Who's On-Call?
組織の構造はさまざまですが、多様なビジネス上の機能とインシデント対応の関わりかたについて、一般的なガイドラインを紹介します。
総じて、あらゆる部署は主要なコンタクト先とオンコールローテーション、そして明確なエスカレーションパスを持つ必要があります。組織においては、常に物事の依存関係が最小化され、できるかぎり対応チームが力を発揮できる状態でなければなりません。しかし、なんらかの新たな状況が発生した際には、誰を支援したらいよいのか分からないこともあるでしょう。そこで、ビジネスにおけるすべての部門から対応者を募る明快なシステムを設けると、手動のプロセスや曖昧なコンタクト先に起因して生じる無駄な時間を削減することができます。
エンジニアリング#
エンジニアは通常、インシデントにおける主要な対応者であり、対象分野の専門家(Subject Matter Expert、以降SME) です。
どのエンジニアリングチームがどの対応に関与するかは、企業の運用モデルによって異なります。一部の組織では「運用チーム」や「SREチーム」が、新たな問題のトリアージと評価を行う初動の責務を担っているかもしれません。PagerDutyの場合は、影響を受けたサービスにアサインされたオンコールのエンジニアが最初のトリアージと評価を行う責務を負っています。
カスタマーサポート / カスタマーサクセス#
サポートは、インシデント対応中の顧客の声を代弁します。カスタマーサポートチームのメンバーは、対応チームにおけるデフォルトの 顧客窓口(Customer Liaison、以降カスタマーリエゾン) となり、インシデントの状況をX(旧Twitter)や社内Slackチャンネル、およびその他のチャンネルで、顧客や関係者に対してアップデートします。また彼らは、社内の関係者が常に最新の情報を得られるよう、連絡役として動くこともあるでしょう。
マーケティング#
マーケティングおよび広報は、インシデントに関する公式なコミュニケーション担う主要な対応チームです。
加えて、企業のブランドやイメージを損なうリスクのある影響範囲や重大度のインシデントが発生した場合であったり、マスメールや企業ブログのような顧客とのコミュニケーション手段を通じて公式なアップデートを行う必要がある際も、マーケティングや広報の出番となります。
プロダクトマネジメントとデザイン#
プロダクトマネージャーやデザイナーは、複数のサービスやプロダクトを横断してプロダクトの機能が影響を受けた際に、インシデント対応チームの意思決定を助けることがよくあります。たとえば、対応チームがどのサービスを先に復旧するかを決める際に、プロダクトマネージャーは、どのサービスが最も顧客影響の大きなものかを判断する支援ができるでしょう。
またプロダクトチームは ポストモーテムのプロセス にも関わり、事後アクションのスケジュール策定に加え、問題の解決のために必要なプロダクトの変更に関する助言にも関わります。
エグゼクティブチーム#
主要なインシデントの発生時に、エグゼクティブチームに対して情報アップデートを行う明快なプロセスがあれば、組織のリーダー陣が十分なコンテキストと必要な情報を得られるようになり エグゼクティブの襲来(executive swoop) を防ぐことができます。 また、インシデント対応中はインシデントコマンダーが最終的な決定権限を持つ一方で、ときに大規模障害時には会社のトップのアクションが必要になる場面もあります。たとえばシニアエグゼクティブは、関係維持のためにも影響を受けた顧客やパートナーへ連絡し、しっかり問題への対処が行われていることを示すとよいでしょう。
セールス#
セールスは通常、インシデントにおける関係者です。デモや顧客との会話に影響が出るようなプロダクトへの影響があった際にはセールス担当者は知っていなければなりませんし、アカウントオーナーは担当顧客への潜在的な影響を理解する必要があります。
人事(HR)#
一般的に人事部門は、従業員の安全や健康に影響のあるインシデントが発生した際のあらゆる対応に関わります。さらに、セキュリティインシデントが発生した際は、内部からの攻撃者の管理と影響を受けた従業員保護の両方の目的から、セキュリティチームは人事の協力を仰ぐ必要が出てくるかもしれません。
財務#
財務部門は多くの場合インシデントの関係者で、請求や会計、および月締めや四半期締めの活動に関わるようなプラットフォームへの影響が生じた場合は、常に最新の情報を入手する必要があります。
しかしながら、サードパーティーの会計管理やその他の関連活動を必要とするインシデント対応の構成要素がある以上、財務部門もまた、明確なオンコールローテーションとエスカレーションパスを設けるべきです。
組織全体について考えましょう!
あなたの組織においては、対応者にせよ関係者にせよ、インシデント対応への参画が必要な他の部門があるかもしれません。異なるビジネスの領域を特定し、彼らが関わる必要が出てくる可能性のある状況を考慮することは、オンコールの担当者の誰もが適切なインシデント対応トレーニングを受け、自身の責務を理解できるようにすることと同様に重要です。