HDDの故障 熱・衝撃による故障

江戸時代の生活は超リサイクル社会でした。使い捨てからの脱却です!

 
Sponsored Links

初めての方へ

Edo119は、故障した中古パソコン・中古家電等の状況や修理・修復方法等のデータなど、様々なお徳情報を集めています。
物を大切に、地球にやさしく、そして人間も大切に!

 Take a Tour

HDDの故障 熱・衝撃による故障


pc.gif

  

HDDハードディスクドライブは、いつか必ず壊れます。

 
p1000192.jpg

 

怒らすと怖いあのお客さんからの苦情メール

大切なあの人からのメールや思い出の写真達

集めに集めた大量の動画や画像集などなど。
  

  

データ復旧会社や経済損失を計算する方が出てくるほど、ある日突然起動しなくなるのがこのHDD。

  

google様から発表されている10万台のサーバのHDD故障調査レポート や カーネギーメロン大学からのレポートなどを元に故障原因とその対策について書いていこうと思います。

  

プロの方には常識になりつつありますので、ここでは良く噛み砕いたものを置いておきます。

主たる故障原因 

主な故障の原因は2つのジャンルに分けられます。

1.データの不良による要因

2.物理的な要因

 

1.データの不良による要因 

 

1-1.データのエラーによる要因

予期せぬ書込みエラーで、システムファイル(レジストリ)が破損してしまう場合があります。

これは回復コンソールやOSの上書きインストールなどで簡単に復旧できます。
ただし、ディスクの細かな傷がによる原因で書込みエラーがが起きている場合がありますので、最下部で詳細を確認しておいてください。 ※初期状態に比べ、数倍壊れやすくなるというデータがあるので要注意! 

 

1-2.ウィルスによるデータの改ざんや消去。

ウィルスによっては、パソコンが起動しないレベルまでファイルの改ざんや削除をされる場合があります。 

パソコンが起動しないレベルまでやられてしまったら、上記と同様の方法で復旧させるか、データを直接操作して復旧する必要があります。でも、データを直接ってのはよほどの方でないと難しいでしょうから、上書きインストールや初期化がベターですね。

他にデータが消去されてしまっていても、データ復旧ソフトなどで復活できる場合もあるのであきらめる必要はありません。

これらでダメな場合は、初期化。。。もしくは専門の業者にお願いするという流れに。

 

2.物理的な要因

OSの上書きしても起動しない。つか、上書きすらしてくれない。。この場合、どうやらデータの問題では無いようです。。。 

 

2-1.マザーボードとHDDの接触不良 

HDDとマザーボードがきちんと接続されていなければ話になりません。
何らかの衝撃で緩んだり、分解後に元通りに繋げていなかったり、ケーブルが破損していたり、はたまたマザー側その他メモリなどの問題だったりする事も考えられます。

 
このケースは少ないとは思いますが、これで治ったら超ラッキー

 

2-2.落とす・叩く・歪む → ディスク・部品(チップやアーム、IC等)が壊れる。

ディスクとデータを読み書きするアームは基本的に接触しています。

電源をONにしてディスクが回ると風やら何やらでちょっと浮いた状態になります。

ここに衝撃を加えたり、ON/OFFを頻繁に行うと、HDDに傷が付き、データの読み取りが出来なくなる場合があります。

その他衝撃で、チップやICが壊れる場合も稀にあるようです。

 

昔から車で走行中にパソコンを使うと衝撃でHDDが壊れるなんて話があります。

基本的にHDDには破損防止機構が搭載されていますが、HDD内蔵DVDナビにはさらにこれはゲル等の吸収剤で衝撃対策が施されている警戒様。

  

2-2.熱による変形・ショート

HDDは鉄やプラスチックですので、もちろん1500℃を超えるような状況ではドロッドロになります。。。

 

そんな破滅的な温度じゃなくても、Googleが管理する10万台のサーバのHDD故障状況レポートでは、50度を超えるような状況だと壊れやすくなるという結果が発表されています。

 

ただ空調が完備されているデータセンターでの統計ですので、台湾の高雄ような40度を超える場所なら、あまり外では使いたくありませんね。

 
熱によって回路がショートしたり、チップが壊れたり等十分あり得ます。

ただ、このGoogleの発表データは、極端でなければ熱が高くても低くても故障する確率に変化はあまり無いぞ。というレポートでした。

 

50度と言う温度もHDDメーカーの想定外の温度なのだそうですから、各メーカーでもパソコンケース内の空調計算をしていますので空調ファンが壊れるようなことがあれば、取り換えましょうと言うレベルのようです。

(60度くらいなら大丈夫というメーカーも出てきているようですけれども、悲しい結果を招いている管理者も少なくないようです。)

 

2-2.湿度等による腐食

湿度が内部に達するようなことがあれば、中の金属が錆び、故障してしまうと言う話があります。

実際に経験されている方もいるようです。 その前に違うところが壊れそうですね。。

 

物理的故障でのデータ復旧は可能? 

これらHDDが故障して、内部に大切なデータを残してしまった場合、チップやアーム等の故障の場合とHDDドライブの傷の場合では大きく異なります。

専門業者にお願いしする場合、ディスクに問題がなければそれを取り出しすべてのデータが復旧できる可能性が高いですが、ディスクの傷の場合は、100%はなかなか難しいようですね。

 

じゃーと言って、ほこりのある皆さんの職場や家庭でHDDを開けるような事はお勧め致しません。

 

 

 
 

元データ google10万台HDD調査データ

 

 ハードディスクの故障の主な原因は熱・HDDの使い過ぎも故障の原因だよな!

 

と思っている貴方はちょっと手を休めてください。

 

・HDD ハードディスクの故障の主な原因は熱ってのが常識??

googleから、サーバ群で使用した10万台を越えるHDDのデータを分析した結果論文が発表されました。

 

google社員でも予想外な結果になったレポートを噛み砕いて説明しておきます。
http://labs.google.com/papers/disk_failures.pdf

 

容量:80GB~400GB
回転数:5400~7200rpm
調査台数:10万台

 
上記の内容で調査した結果がレポートされています。

 

 

deta1.gif

  

まず、稼働期間によって故障率が変わります。1年未満の場合が約2%に対し、2年以上経過すると7~8%の割合で故障があったようです。また、S.M.A.R.T.の予想結果と上記のデータは連動していないようでした。 

 

S.M.A.R.T(セルフモニタリング・アナリシス・アンド・リポーティング・テクノロジー、略称: S.M.A.R.T.(スマート)
http://ja.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology
ハードディスクドライブの障害の早期発見・故障の予測を目的としてハードディスクドライブに搭載されている機能。

  

deta2.gif

何万台もありますので、使用頻度に差が生じます。
googleでは、そりゃ使いまくっている方が壊れやすいだろう?と予想していたようでしたが、結果は予想外だったようです。

 

最初の6カ月は初期不良なのか6%の差はありますが、1番故障しなかったのは中程度の使用率。
それでも2%の差なのでほぼ同じでしょう。 それを超えると1%未満の誤差だったり症状が逆転している場合も使用頻度に差はあまりありませんでした。

 

deta3.gif

これは、横に温度が並び、 ● が温度における故障率。 縦棒は平均温度でのドライブの分配です。

50度を超えると率が跳ね上がるのは当然として、逆に低い時に故障しやすいようです。
20度~25度で%が高いのは、分母が小さいからでしょうね。

 
 

deta4.gif

壊れたドライブの過去ぶん回し平均温度のグラフです。

初期不良分は置いておいて、3年までは低い温度の物が故障しやすいようです。1%程度の誤差ですが。。
3年目は何なんでしょうね。際立っているとしか書かれていないような。

対策しなければならないレベルの差はないと言う事らしいです。

 

 

deta5.gif
クリックで大きくなります。

これは稼働中にスキャンエラーやリアロケーション(read/write時で検出された不良セクタ)が発生し、復旧できたHDDのたどる結末です。

 
見た目通り。。。亡くなる率が跳ね上がっています。

 

実は私が今使っているマシンも数ヶ月前にリアロケーションが出ました。(2回ほど)回復コンソールで復活したんですがね。。なんというかこれデスノートですよね?SDDにしようかなぁ。。

 

まとめ。 

年間を通して、熱や稼働時間に関係なくほぼランダムに5%程度が故障していくそうです。

どのメーカーが壊れやすいかというデータは配慮されて発表はされませんでしたね。

つまり、いつどれが壊れるか予測があまり出来ないというようでした。

ちなみにgoogleではこのためか、データは常に3個用意していて、いつ壊れてもOKにしてあるようです。

 

このデータ発表についての予測

 
ここからは予測なんですが、 google様としても10万台もあればソリャ激しいコストですよ。
使い方でHDDの寿命が延びるなら改良してコストカットしようぜ! と言う思惑もどこかにあってこう言うデータを取っていると思うんですね。で、高い温度(50度以上)これはNGなんで対策はしているのでしょう。

 

使用頻度が高い物が壊れやすいなら出来るだけバッチ処理させるとか、50度じゃなくて40度以上から壊れやすくなるなら、もうちょっと寒くしようとか考えていたんだと思うんです?

 

で、結果が使用頻度はあまり関係ないし、温度は逆に寒すぎる方が良くない。40度くらいが快適だと言ったデータが出てびっくりしたもんだからじゃー面白いので公開しちゃおうかと言うノリな予想です。笑

 

ただ、このデータは管理が行き届いたデータセンター内のデータなので私達のHDDはこれにすべて当てはまるわけではありません。ON/OFFを頻繁にする私達のマシンは停止時にアームがディスクにくっ付きますので、回しっぱなしのサーバと異なり摩耗もしやすい事でしょう。

 
しかもノートなら持ち運ぶし、、地震はあるし、、梅雨でじめじめするし、、冬寒いし、、それを差っぴいても面白いデータを発表していただいたなぁと思っています。

 

 

 

元データ ディスク故障の現実

 

メーカー発表の故障率だと、平均故障間隔 100万時間!約114年故障しないよん。 

 

何年くらいHDDは使えるのでしょうか?平均故障間隔 100万時間つまり114年と言う話があります。

 

平均故障間隔 100万時間 の検索結果 約 12,600 件 google調べ。 これだけある。

 

前回のgoogleのデータを見ても、ボコボコ壊れていますね?

米カーネギーメロン大学のBianca SchroederさんとGarth A. Gibsonさんが2007年初めに

 

1,000,000 hours mean to you?(ディスク故障の現実:100万時間のMTTFの意味)

http://www.usenix.org/events/fast07/tech/schroeder/schroeder_html/index.html

 

というレポートを出しています。 真剣に検証したんでしょうねー。

HDDの年間平均故障率 メーカー公称値では0.58~0.88% だけど0.5%~13.5%だぞ!と言っているのですがピンときません。

 

いろいろなブログで15倍かーそうだよなービックリ。 と言う解釈をされている方もいますがそもそもの計算方法がちょっと違うので100万時間という数値が出ています。

 
こんな数値はあまり意味がなく、壊れるときは3か月以内に壊れてしまうものなのでザックリ。
MTTF という計算方法で平均故障率100万時間は計算されているのですが、
これは、我々の平均寿命のようなタイプの計算方法とかなり違うためこの数値になっています。

 

HDDは大きな会社だと数10台から数万台稼働しています。

基準として、数万台のHDDを一気に○時間動かした時故障したのが△台でした。

つまり、100万台のサーバを一気に動かす仕事をするならば、弊社のHDDを使ってくれるなら平均で1時間1台も故障せずに動きますよ

という指数。 逆を言うと100万台で24時間動かせば24台くらい壊れるんじゃないかなーのような物です。

(間違っていたら突っ込んでください。。かなり適当。)
MTTF も計算方法がなんか場所によって違うとか言う話ですし我々には関係ありませんね。

 

まとめ

 

・HDDは運が悪いとすぐに壊れる。
・バックアップは必ず取る。出来れば2個以上
・極端な温度湿度を避け、衝撃を与えないように気をつける。

余裕があるなら、SDDのような物に取り替えてみる。
 

ちょっと長い文章だったので、よくまとめずに書いています。おいおい整理しまーす。

間違い・不備・新情報がありましたら、以下に書いていただけると、大変助かりますです。

4 Responses to “HDDの故障 熱・衝撃による故障”

  1. jobz Says:

    関連情報のリンクが複数有り、参考になりました。ありがとう。

  2. KAZ Says:

    HDDは電源断の時に必ずシッピング(ディスクの待避領域にヘッドを動かすこと)動作が発生します。
    これは、突然の電源断でも、ドライブ基板内で蓄積した電流で動作するようになっています。
    この機能がないと、回転が低下してきたときにヘッドが記録面をひっ掻く形となり、ディスク面は損傷します。また、鏡面状の記録面と、鏡面状のヘッドを接触させたままにすると吸着現象が発生し、二度と回転できなくなる事もあります。
    逆に電源ON時にも、回転がある程度上昇してから、ヘッドが記録領域内に入るようになっています。
    古い時代のHDDでは、バネでシッピングする機構もあったようですが、高速シークのためボイスコイルタイプのヘッドになってからは、電気的に移動する機構が設けられています。
    シッピング動作は、HGST,WDではディスクの外側に、その他のメーカではディスクの最内周に移動する様になっており、最内周に移動するタイプの物では、起動/停止の度にシッピングゾーンの摩耗が発生するので、起動/停止回数の寿命があり、外に逃げるタイプと比較して寿命はかなり短い。

    ※貴殿の表現では、シッピングについて明確な説明が見あたらず、回転停止時には記録面上にヘッドが留まっているような誤解が生じる可能性があると思い投稿しました。

  3. smilemonica Says:

    >>KAZ様

    追記ありがとうございます。

    まさしくその通りです。

    感謝いたします。

  4. 温故無知新 Says:

    消費者用HDDの激しいコストダウン競争でHDDメカが単純化されて部品点数が減っています。

    (2TBのHDDの内部が20年前の20MBのHDDにそっくりな幼児退行現象)

    ヘッドパークメカがバネとディスクスピンの風圧で動く単純なフラップ式。
    アクチュエータなし、リフトなし、ラッチなし。

    トライボロジーや新素材の技術の進歩で磨耗や固着の問題がほぼ解決されています。

    (自動車用エンジンの例では、クランクシャフトがベアリングレスになってきた!)

    サーボや補正や修復の機能が良くなったのか、見た目の加工が荒くなっています。

    大容量化して1bit当りの記録面積が減れば使用中に自ずと欠陥セクタが増えていきますが、一般用HDDが風評被害を恐れて正確なS.M.A.R.T.値を出さない傾向なので、安いHDD管理ソフトによる障害予知が困難になってきています。

    故障を減らすには、安上がりなRAID6を組むか、本格的にはSAS規格の業務用HDDを使い、iSCSIで繋いで、管理ソフトで冗長化すると良いでしょう。

Leave a Reply