分かりやすく説明したことによる疑問
10/1 終日東証のシステム障害による取引停止の説明が先ほどあった。
天下の富士通が構築したシステムなので、多分説明をわかりやすくしたため、自分的にはちょっと違和感があった。
違和感その1.メモリ故障
想定以上のデータが流れ込み、処理が追い付かなかったことが原因だったとか
であれば納得できるが、メモリの障害ってシステム監視していれば、早々にわ
かるのではなかろうか。システム監視端末でHWの状況が一目瞭然ではない
か!?これがわからないのであれば、今後も大問題である。
特殊な場面で使われるメモリのようなので、しょうがないかもしれない。
正直100%動き続けるシステムはないと思っているので、障害が重複して起
こった場合はしょうがないと思う。
今回は、東証のシステムダウンということで、直接人の命が係わる出来事では
なかったかもしれないが、これが、防衛省のシステムであるならば、ミサイル
が飛んできても、国籍不明機が飛んできても、対応できないため、人命が損な
われますね。
となると、よっぽど防止できなかった障害でなければ、富士通に24時間36
5日動作し続けるシステムの発注は怖くてできませんね。
違和感その2.システムの切り替えができなかった
バックアップの試験もさまざまな状況下での試験ができないので、今日の状況
下でが、うまくいかないパターンだったのでしょうか
1日止めていたのだから、HW障害なら、原因はとっととわかっていたはずなのに、なぜ、19:30に明日から大丈夫という判断になるのでしょうか。重要システムにも関わらず、あまりにも脆弱すぎます。
10/1という日も微妙です。本当はプログラムの不具合ではないでしょうか。
HDD障害はいつ起こるかわからないということで、同情の余地がありますが、10/1リプレイス(勝手な予想です)したプログラムの不具合が原因となると、言い訳ができませんね。
と、ど素人が勝手に書きましたが、本当に大規模システムの運用は難しいです。
技術者の皆様には大変ご苦労ですが、しっかりしたシステムを構築していただきたい。
今、中国、韓国などIT大国がどんどん出てきて、いつもの間にやら日本は置いてきぼりになっていますので、ここで信頼を勝ち得て、IT世界1を目指しましょう。
原爆2発も落とされても這い上がった日本です。
天国にいる日本人に恥じることのないよう、日本を復活させましょう!!