Doblog障害から学ぶこと

障害復旧時の障害まで考慮しないとだめなんだなー。あとバックアップが2008/08/04未明の時点のデータって…。最低2面のバックアップが必要だったんじゃないかなと思います。あと同時期に同じハードディスクを買わないとか…。
以下、障害お知らせの抜粋。
http://www.doblog.com/

2009.2/11 16:00 Doblog編集部
Doblogのデータベースサーバのハードディスクに障害が発生しており復旧作業を実施中です。

↑DBサーバ死亡確定か。RAID組んでるだろうけどやっぱりダメなのね。

2009.2/15 0:00 Doblog編集部
2/8 10:00頃、Doblogのデータベースサーバー及び、バックアップサーバーの両サーバーにハードディスク障害が発生し、当日より内部データの復旧作業を行っております。現在も復旧作業を継続中ではございますが、当初2/13に復旧完了予定であったデータにエラーが発生、

↑DBサーバとバックアップサーバも死亡とか…。うーむ。

2009.2/22 0:00 Doblog編集部
現在は、2008年8月4日未明のデータにてサービスを稼動させております。(2003年11月4日のサービス開始から2008年8月4日未明までの全ての記事を閲覧可能です。)

↑なぜこの時点なのかは分かりませんが「無」になることだけは避けられましたな。
ブログサイトは、ユーザ数だけではなく、画像を載せられるようになり超巨大化してますよね。どんなバックアップをしているのでしょうか?同様の障害が起こると「無」になるところもあるのでは?運営を信用して書いた日記が「無」になるのはさすがに信用ガタ落ちですな。(逆にこういう障害が起こった方が対策とられて安全だったりして。)