Diary

@ssig33

31 May 2017 Wed 23:06

Web アプリケーションのインフラ等の即応対応要員の問題だが 、単純にいって 1 年間は 9000 時間弱ある。一方人間の稼働時間はというと、土日祝日盆正月で 120 日、これに年次有給休暇が 10-20 日はある。 Web 業界では平均勤続年数がさほど長くないからここでは有給 15 日で計算するとして 230日 * 8時間 で 1840 時間ある。 面倒なので 1800 時間としよう。

単位時間あたり二人の要員をアサインする場合 8 時間交代でぎちぎちに監視スケジュールを組んだとして単純にいって 10 人いれば事は足りるということになる。突発的な事態については他の開発者にも応援を要請するとしても、とにかく 10 人は必要である。

実際のところ、昼間の業務から完全に外してとかじゃなくて、昼間のインフラ開発の業務も行いつつ定期的に深夜番や早朝番などを続ける形で入れていくことになるだろうが、総じて最低限で 10 人必要というのは動かない。大星ビル管理事件というのがあって、即応体制を会社から義務付けられた要員はたとえその時間寝ているだけであっても労働時間ということになる。また監視対象のシステムが大規模になるにしたがって必要な人員は 2 倍 3 倍と増えていくことだろう。

銀行やら 24 時間稼働の製造業やらあるいは Web 系であっても景気のいいところならこのあたりきちんとした体制をとっていることだろうと思う。実際 Uber の SRE チームには 100 人を越えるインフラエンジニアがいると聞く。

ただ現実には日本の Web 系でそこまできちんと抱えられるのは極一部の大手に限られるだろうし、結構勢いありそうなところでも SRE チームが数人みたいな話は聞く。でも結局その人数だと SLA 提供できないわけで(やれば長時間残業など違法行為になる可能性が高い)、もうそれだったらやっても無駄、最初から 24 時間運用監視とか諦めた方がいい。こういうものは必要に達していないマンパワーを用意したところでそれは壮大なる無駄に過ぎない。 30 発撃てばだいたい目標に命中するという精度の大砲を持っていた時に、砲弾を 10 発しか持っていなければそれはもうその砲を持っていることは全く無意味であるのと同じような問題である。

我々は Heroku に乗っかってやっていっています。今のところ Heroku, Google Apps Engine, AWS Beanstalk などしか信用できるアプリケーションを普通の日本の Web 系が提供する手段はないと思う。それくらい日本の市場が小さいという話でもある。