ダウンロード資料
「エンタープライズ企業の障害対応革新 – PagerDuty導入とその成果」イオンスマートテクノロジー株式会社 齋藤 光 氏、林 如弥 氏 – PagerDuty on Tour TOKYO 2024
JTCとしてのイオンスマートテクノロジー株式会社が、障害対応プロセスをどのように改善したかを紹介します。
PagerDutyの導入により、MTTA(Mean Time to Acknowledge)を大幅に短縮し、複数の開発チームと運用チームとのアラート方針のディスカッションを通じて、生成AIを活用した”PagerDuty Advance”の導入も行いながら迅速な障害検知と対応を実現しつつあります。
PagerDutyの導入をきっかけに全体のプロセス改善を目指した挑戦の全貌をご紹介します。
この動画で得られること
1️⃣ PagerDuty導入前の課題
- 全員参加型の障害対応ができていなかった(多くの人が集まるが、発言は1-2人のみ)
- 障害対応中のアクションが適切に記録されていなかった
- 後から参加した人が状況を把握しにくかった
- 重要な障害の振り返りを共有する仕組みがなかった
- 特定のツールやExcelを使用して対応していたため、拡張性や編集性に問題があった
2️⃣ PagerDuty導入後の改善点
- オンコールスケジュール、エスカレーションポリシー、個人ごとの通知ルールを柔軟に組み合わせた障害対応体制の構築
- 不規則なオンコール体制の実現
- NewRelicやAzure Monitorなど700以上のツールとの統合が可能に
- Dynamic Notificationによる重要度に応じた通知方法の設定
- シングルサインオン(Microsoft Entra ID)によるアカウント管理の簡素化
3️⃣ イオンスマートテクノロジーでのPagerDuty活用
- 障害対応の民主化(開発チーム主体の障害対応の実現)
- PagerDuty AIOpsとPagerDuty Advanceの活用による障害状況の把握と共有の効率化
- 障害対応ガイドの作成とPagerDutyの機能を組み合わせた総合的な改善
※本動画は、2024年8月に開催された「PagerDuty on Tour TOKYO 2024」での講演を録画したものです。
以下のフォームを入力し、
動画を視聴