2009年06月07日

「システムはなぜダウンするのか 知っておきたいシステム障害、信頼性の基礎知識」を読んだ



システムはなぜダウンするのか 知っておきたいシステム障害、信頼性の基礎知識を読んだ。

過去の日経コンピュータなどの記事から、システムダウンの事例を取り上げ、ソフトウェアの不具合、ハードウェアの不具合、設定・操作ミス(運用でのミス)などの話を取り上げている。事例として参考になる内容。また、基礎から学ぶという位置づけの本でもあり、たまにシステムの初歩の話も入っているので、知らない内容についてはありがたい。

ジェイコム誤発注とかみずほ合併時のトラブルなどの有名な話から、二重化しているサーバが両方ともハード故障になったとか、データセンター自体の停電とかいったマニアックな内容まで触れている。ネットワーク屋としては、スパニングツリーのループの例は身近な話題だと思った。

一番最後のほうにシステムダウンはすべて「悪」なのか、という内容で、コストとのバランスやダウン時の報道などの過剰反応などについて書いてある。このテーマは重要なのでもっとページを割いて欲しかったと思うが、まったく触れられないことと比較すると、ちゃんと書いてくれたと思う。実際にシステムを担当している人は大変なんだよなぁ。

たまにはこういう本を読んで、自分が担当しているシステムを見直す機会になればいいと思った。
posted by mako at 15:59| 東京 ☁| Comment(0) | TrackBack(0) | 読書(ビジネス本・その他) | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。