IT業界のサクラダ・ファミリア
いつまでも完成しないシステムという意味で、誰が言い始めたかわかりませんが、上手い事言ったものです。
もう何度も見すぎてて、みずほ銀行のシステムトラブルのニュースを見ても、何も感じなくなってきましたよね。
今回はそんなみずほ銀行プロジェクトのIT業界の闇をお話します。
みずほ銀行のシステムの歴史
元々3つくらいの銀行が合併して誕生したのがみずほ銀行です。
それぞれの銀行で独立していたシステムを統合しなくてはいけませんが、どの銀行が主導権を握るかで揉めて、どこの銀行に寄せるのか寄せないのかと、結局ぐだぐだしたまま開業することになってしまいました。
その結果、開業初日からATMや公共料金の口座振替に遅延が生じるトラブルが起きて、その対応も後手後手でした。これが2002年の出来事でした。
その後、東日本大震災の義援金で10,000件以上の振込があった影響で処理が追い付かなくて大規模障害が発生しました。2011年ですね。
そんな障害が起きてようやく、「ちゃんとシステムを見直そう」と至りました。
また、2つくらいの銀行が合併してできたみずほコーポレート銀行に吸収されたりもして、大規模なシステムを統合・刷新するプロジェクトが動き出しました。
ITベンダーと費用
「富士通」「日立」「NTTデータ」「日本IBM」の4社が担当することになりました。
こんなに多くのベンダーが参加することはあまりありません。それぞれ会社のやり方もルールも違うのに一緒になってやるのはかなり無理があります。
でも統合前のそれぞれの銀行のシステムを担当していたベンダーがそのまま参加したからこうなってしまい、機能毎に作業分担しました。
なんかもう既に上手くいく気がしませんね。
総額は4000億円を超えたみたいです。
ディズニーシーで3350億円ですよ?
それより高いってどんなんよ!!!と思ってしまいますよね。
普通こんな規模のシステム開発なんてありません。
すごいプレッシャーだと思います。
でも4社も参加すると、責任の所在が曖昧になります。何かあったら誰が責任取るのでしょうか…。
それぞれの分担した機能だけ開発すれば良いわけではなく、他の機能とのつながりも考慮する必要があるんですけどね…。
どう頑張っても回すのが難しいプロジェクトです。
大量に人が必要!!どうするか?
こんな規模のプロジェクト、4社それぞれのメンバーだけでは到底足りません。
ではどうするか?
そう、外注です。
下請けにどんどん仕事を出します。
まさに「多重下請け構造の闇」が爆誕するわけです。
(参考記事)
携わったベンダーの数は1000社を超えると言われています。
スタートが4社なのに、それぞれが下請けに出し、その下請けも下請けに出し…と何次請けも発生する状態になっていました。
日本のIT企業の1割くらいがこのプロジェクトに携わっていると言われているようです。
犠牲者が、そんなにたくさんいたんですね。
管理しきれるわけがない
10名や20名のプロジェクトですら管理できていないことがよくあります。
プロジェクトや人を管理するってとても難しいのです。
では、関わった会社が1000社を超える巨大プロジェクトを管理できる人なんているのでしょうか!?
……いなかったのでしょうね。
その結果、2016年に「プロジェクトマネージャー」の募集が発表されました。
1000社の人間が誰も管理しきれないプロジェクトを外部の人間に任せようとしてたんですよ!?
信じられませんでしたね。いやー、びっくりしました。
ぐだぐだのスケジュール
当初は2016年の3月にシステム完成の予定でしたが、延期が発表されました。
普通のプロジェクトでもたまにあることです。1週間かな?2週間かな?どれくらい延期されたのかな?
…9カ月でした。
こんなに遅れるシステム開発、中々ないですよ。
2016年の12月になっても終わらず、さらに数カ月の延期も発表されます。
いやいや、遅れすぎでしょ…。
そんなこんなで、2017年にようやくシステムが完成しました。(一応)
その次に行われるのが「移行作業」です。
古いシステムと新しいシステムを入れ替えるんですね。
これを約2年かけて行うスケジュールでした。
これだけ大規模な移行計画、聞いたことがありません。
そして、この移行作業中の2年の間にも障害がたくさん発生していました。
そうして2019年にようやく移行が完成したわけです。(一応)
2021年、通帳が吸い込まれる問題
ATMが使えないだけではなく、キャッシュカードや通帳がATMに吸い込まれてしまう障害が発生しました。
これが起きた理由もやっぱり移行なのです。
定期預金のデータ25万件を移行と月末定例の45万件の処理が重なって、システムが耐えられなくなったみたいですね。
多いと感じる方もいるかもしれませんが、エンジニア目線で言わせてもらうと、60万件のデータ処理って別にそんなに多くないです。
「ふつうはこれくらいの処理をした場合これくらい時間がかかるな」とか、「1件当たりこれくらいの負荷がかかるから少しずつ移行しよう」とか計画を立てて慎重に行います。
お客さんの業務を止めないように、何度もシミュレーションして、慎重に慎重に行うものです。ふつうは。
手抜き、もしくは想像力があまりにも足りなかったのでしょうね。
にわかには信じられません。
エンジニアあるある
みずほ銀行に限った話ではないですが、エンジニアはシステム障害のニュースをみるたびにハラハラします。
いつ自分が原因で障害を発生させてしまうかと考えると、他人事ではありません。
ましてや日本のエンジニアの10人に1人はみずほ銀行のプロジェクトにかかわっているので、そのハラハラはすごいでしょうね。
まあ、そんなに責任感をもってやっているエンジニアも少ないかもしれませんが…。
適当な人が本当に多いので…。(以下の記事でも扱っています)
いかがでしたでしょうか?
今までは「よくわかんないけど、またみずほでなんか起きてるんだな」と大して気にしていなかった方も、一体何が起きていたのか知っていただけたら幸いです。
サクラダファミリアと呼ばれなくなる日はくるのでしょうか…。
(2021/09追記)
とんでもない発表がありましたね。
以下の記事をご覧ください。
以上、最後までご覧いただきありがとうございました。