Home
この文書は、PagerDutyのインシデント対応プロセスの一部をカバーしています。これは、PagerDuty社内で重大なインシデントが発生した場合や、新入社員がオンコールの責務を担う準備をする際に使用される社内文書の簡略版です。インシデントへの備えだけでなく、インシデント発生中および発生後の対応についても情報を提供しています。オンコール要員や運用中のインシデント対応プロセスに関わる人々(または正式なインシデント対応プロセスを導入したいと考えている人々)が利用することを想定しています。この文書が何であり、なぜ存在するのかについての詳細は、About ページを参照してください。
何から始めたらわからない方へ
インシデント対応が初めてで、まだ組織内に正式なプロセスがない場合は、まず Getting Started ページを参照し、最初にやることの簡単なリストを確認することをお勧めします。 さらに、Training Course ページで、当社のプロセス概要について詳しい情報を得ることもできます。
オンコールについて#
オンコールの経験がない場合、オンコールとはどのようなものか疑問に思うかもしれません。これらのページでは、オンコールに求められること、およびオンコール対応を支援するリソースについて説明しています。
- Being On-Call - オンコール時のガイド。オンコール担当者の責任と、責任でないことについて
- Who's On-Call? - 誰がオンコールを担当するのか
- Alerting Principles - いつ・どのようなときにエンジニアを呼び出すかについて、判断するための原則
インシデント発生前#
インシデント発生前に知っておくべき情報。実際のインシデント発生中は、これらを読んでいる余裕はないでしょう。
- What is an Incident? - インシデント対応について語る前に、インシデントとは実際に何なのかを定義する必要があります
- Severity Levels - 自社の重大度レベル分類に関する情報。SEV-3とSEV-1の違いは何か? どのような対応が必要になるのか?
- Different Roles for Incidents - インシデント発生時の役割(インシデントコマンダー(IC)、書記官など)に関する情報
- Incident Call Etiquette - インシデント会議のエチケットガイドライン(会議に参加する前にご確認ください)
- Complex Incidents - 大規模で複雑なインシデントへの対処に関するガイド
インシデント発生中#
重大インシデント発生中におけるプロセスおよび情報です。
- During an Incident - インシデント発生時に何をすべきか、建設的に貢献する方法に関する情報
- External Communication Guidelines - 外部向けコミュニケーションのガイドライン
- Security Incident Response - セキュリティインシデントは、通常の運用インシデントとは異なる方法で対応されます
インシデント解決後#
過ちを繰り返さないための取り組み、常に改善を続けるためのフォローアップのプロセスです。
- After an Incident - インシデント解決後に取るべき対応に関する情報
- Postmortem Process - ポストモーテムのプロセス、その内容、およびポストモーテムレポートの作成方法に関する情報
- Postmortem Template - 重大インシデントのポストモーテムレポートを作成する際に使用するテンプレート
- Effective Postmortems - 効果的なポストモーテムレポートを記述するためのガイド
危機対応#
インシデント対応は、技術的なインシデントへの対処だけではありません。危機はいつでも起こり得ます。あなたの組織では備えができていますか? 最悪の事態への対処の仕方によって、現在の顧客や潜在顧客の目には、自社のブランドやその価値がどう映るかが決まります。
- Introduction - 危機対応の概要と、この文書の対象者について
- Terminology - このガイドで使用される主な用語と概念の一覧
- Crisis Leadership - 基本原則と自社の価値観を対応に組み込むことについて
- Crisis Response Operations - 危機対応計画の実行
- Pre-crisis Phase - 準備のための活動を最大限に活用し、チームを常に準備万端にしておくことについて
- PagerDuty for CRMOps - 当社がPagerDutyを危機対応管理オペレーションに活用している方法
トレーニング#
インシデント対応について学びたいですか? こちらをご覧ください。
- Training Overview - 当社のトレーニングガイドとサードパーティによる追加トレーニング教材の概要
- Glossary of Incident Response Terms - インシデント対応に関する用語とその定義の一覧
トレーニングガイド#
- Incident Commander Training - インシデント対応チームの指揮官(インシデントコマンダー)になるためのガイド
- Deputy Training - 副指揮官(Deputy)となり、インシデントコマンダーを支援する方法
- Scribe Training - 書記官(Scribe)になるためのガイド
- Subject Matter Expert Training - SME(Subject Matter Expert)、そして重大インシデントに関わるすべての参加者の責任と行動に関するガイド
- Customer Liaison Training - インシデント発生時に顧客向け連絡係(Customer Liaison)として行動するためのガイド
- Internal Liaison Training - インシデント発生時に内部向け連絡係(Internal Liaison)として行動するためのガイド
トレーニングコース#
- Incident Response Training Course - インシデント対応とインシデントコマンダーの役割に関する入門コース
その他の情報#
インシデント対応に関連する外部の有用な資料や情報です。
- Reading - インシデント対応に関連する推奨読み物
- ChatOps - この文書で参照しているチャットボットコマンドの説明
- Anti-Patterns - PagerDutyが自社で試した結果、却下したもののリスト - 私たちの過ちから学ぼう