Prev / Next / /home/pochi/ChangeLog

サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開[運用][コンピュータ]

2012-08-09

http://www.publickey1.jp/blog/12/chaos_monkeynetflix.html

Chaos MonkeyはAmazonクラウド上で使うツール。
Amazonクラウド上のインスタンスをランダムに落としまくることで、
サービスに対して仮想的な障害を引き起こしてくれます。


エンジニアがいるときだけ、わざと障害を起こせる


あえてわざと管理された範囲内の障害を日常的に引き起こし、
それに日常的に対応できていることを証明し続けることで、
本物の障害が起きても問題なく対処できることが証明できるわけです。


なるほどねえ。

消防や警察や軍隊がやっちゃ駄目な気はするけど。

permlink