仕事中に、
『社内サーバにアクセスできない。』
と問い合わせがあったので調べてみると、社内サーバに使っている、RAID5のディスクのうち1台が故障していた。
で、RAID5だから新しいディスクに入れ替えればいいかー。
ということで新しいディスクを探してみると…。
『予備がない。』
『RAID5構成なのに、なぜ予備を揃えておかない?』
と思いつつ、このマシンを購入したときの販売元に問い合わせると、
『同型のHDDについては、販売を終了している。』
とのことorz
こういうサーバ系のパーツって、ある程度の期間は在庫持ってて欲しいなぁと思いつつ、とは言えいつまでも同じパーツを在庫として持つのはコストになってしまうので、普通は導入した元(つまりうちの会社)が予備ディスクを持っておくべきなのかなぁ。
で、メーカーとしては動作保障の無い、使用中のディスクより容量の大きいものなら手配できる。と言われたけれど、動作の保障も無いし(まぁ動くかもしれないけど)、値段もそこそこした上、今後、継続的にRAID5の構成にする必要性も感じられなかったので、このディスクの購入は保留に。
取り急ぎシステムを稼動させる必要がある。
ということなので、OSをクリーンインストールしようとすると、マシンにつながっているHDDの3台すべてがRAIDコントローラ以下にぶらさがっており、そもそもOSのインストール段階でRAIDコントローラのドライバが必要になる。
のに、このマシンにはフロッピーディスクが無かったorz
と言うわけで、やむなくATAPI接続のHDDであまっていたものを取り付けてOSをインストールしなおしてシステムを稼動させた。
このマシンに保存してあったデータ自体は、定期的にバックアップをとっていたのでさほど大きなデータの損失は無かったのが不幸中の幸い。というところか。
一言で言えば、今回の件に限って言うと、
RAID5構成の意味が全く無かった。
むしろ、システムの故障率を3倍にしてしまっただけだった。
と、言わざるを得ない。
もちろんこれはRAID5が良い悪いの話ではなくて、そもそも予備のディスクさえ備蓄していればダウンタイムも短く、データの損失もゼロだったのに、その備えをしていなかったがために、システムの持つメリットを全く生かせなかった。という恥ずかしいお話。
ハードウェアの導入から、許容できるシステム復旧までの時間、扱うデータの重要性などを、トータルで設計考えてシステムを導入・運用しないと、あまり意味が無い。ということを、身をもって勉強させていただきました。
とりあえず今は仮運用の状態で動かしているので、今度は求められる要件の定義とそれにあわせたシステムの稼動をする予定(^ ^)
最後に、復旧作業中、Twitterでいろいろと教えていただいた皆様、ありがとうございましたm(_ _)m