公式資料
「デジタルオペレーションの現状」独自調査レポート
エンジニアの燃え尽きを防ぐ秘訣とは?
一段と信頼性の高いシステムを顧客が求めるようになり、勤務時間外や夜間の対応など、技術チームへの要求も増しています。本レポートでは、19,000 社以上、100 万人を超えるユーザーで構成されるPagerDutyプラットフォームから収集したデータを基にしたシステム運用の”今”を解説!→ PagerDutyの資料をみる(無料)
レトロスペクティブガイドを発表した際、RetroDutyのコミュニティを設立することで、PagerDutyにおける製品開発以外にも継続的改善のマインドセットを広げる価値について書きました。今回は、レトロスペクティブに関するブログ記事シリーズとして、ポストモーテムとレトロスペクティブの違いを明らかにしたいと思います。
PagerDutyのガイドを読む以前にも、ポストモーテムやレトロスペクティブについて聞いたことがあるかもしれません。どちらも、最近のプロジェクトやチームのワークケイデンスで起こったことをレビューする、という同じ目標を持っているように見えます。
しかし、ポストモーテムとレトロスペクティブの間には、微妙な違いがあります。そこで、この記事では、それぞれのプラクティスから得られる最大の価値について説明したいと思います。
目次
インシデント対応における「ポストモーテム」とは、システム障害やインシデントが発生した後に、その原因を分析し、インシデントの再発防止策を検討するためのプロセスのことです。ポストモーテムは、日本語で「事後検証」と訳されます。
ポストモーテムは、インシデント対応に関わるメンバーが平時に振り返りを行うことで、対応は適切だったか、改善できるところはどこか、そして最も重要な点として、インシデント対応プロセスで同じミスを繰り返さないためにはどうすればよいのかを検討します。また、影響を受けたシステムやインシデント対応プロセスを改善するためのアクションを特定し、これらのアクションアイテムが確実に実行されるように賛同を得る話し合いの場でもあります。
レトロスペクティブは、チームが設定した一定の間隔で、進捗状況、作業速度、納期をレビューする機会です。これは、チームが影響を受ける仕事やコラボレーションについて、安心して話し合える場を提供することを目的としています。この話し合いをもとに、チームで懸念事項や改善点に対処するためのアクションアイテムをいくつか決定して、それにオーナーシップを割り当てます。そうすることで、チームが責任を持ってこれらの変更を実施し、その後もその効果を評価するようにするためです。
ポストモーテムガイドで述べたように、インシデント対応を引き起こしたあらゆる事例を含めた、すべての主要インシデント(重大度-2および1)でポストモーテムを実施します。インシデント対応プロセスに関わった全員にとって状況が鮮明なうちに行えるように、ポストモーテムはインシデント解決直後に行います。
一方、レトロスペクティブは通常、チームの判断によって一定の間隔で実行されます。例えばPagerDutyでは、アジャイルデリバリーチームのレトロスペクティブを隔週で実施しています。主要プロジェクトまたはプロジェクトのマイルストーンの達成後には、関与したチームの判断で、1回限りのレトロスペクティブを実施することもあります。
ポストモーテムは、インシデントに直接関与したチームの間でインシデント解決後すぐに行われる話し合いで、責任をなすり付けることなく、根本原因の分析を行います。インシデント対応プロセスそのものを振り返り、改善点を話し合うことも、ポストモーテムプロセスの主要な側面です。
通常、レトロスペクティブは、同じチームのメンバーであったり、同じプロジェクトやプロジェクトマイルストーンを目指す複数のチームのメンバーであったり、参加者が気軽に行う話し合いです。進行役は、幅広いレトロスペクティブのスタイルの中から、最も効果的にチームの会話をリードできるようなスタイルを選択します。適切なレトロスペクティブスタイルを選択するにあたっては、当社のレトロスペクティブガイドでPagerDutyのガイドラインをチェックしてみてください。
ポストモーテムミーティングでは、インシデントの原因、タイムライン、お客様への影響、提案されたフォローアップアクションアイテムに沿って、関与したチームがポストモーテムレポートをレビューします。しかし、話し合いでは、ポストモーテムレポートに記録されている目前の課題にとらわれすぎないようにします。結局のところ、この時間をもっとも有効に使う方法は、ポストモーテムレポートの詳細な分析から一歩離れて、インシデントを引き起こした体系的な要因をより良く理解することです。よって、ポストモーテムミーティングの成果として最優先なのは、アクションプランの賛同を得ることです。
レトロスペクティブは、参加者がどのように作業を進めたのか、長所と改善点を振り返って話し合う機会となります。チームはまた、今ケイデンスがどうだったのか、プロジェクトやプロジェクトマイルストーンの目標に向けてどう努力したのか、お互いに認識を共有してもいいでしょう。レトロスペクティブの主要な成果は、チームの交流とプロセスを継続的に改善していけるようにアクションアイテムを決定することです。
ポストモーテムの進行役は、トリアージを行い、問題を解決したキーメンバーを含める責任があります。インシデントコマンダー、インシデントコマンダーの訓練生(もしいれば)、サービスオーナー、インシデントに関連のある領域の専門家 (SME)、影響を受けるシステムのエンジニアリングマネージャーやプロダクトマネージャー、カスタマーリエゾン(重大度-1のインシデントの場合)などが、ポストモーテムミーティングに参加します。
レトロスペクティブの進行役は、ワークケイデンス、プロジェクトやプロジェクトマイルストーン、その他必要な役割に関与するチームを含める責任があります。レトロスペクティブにおいて各参加者が果たす役割についての詳細は、こちらをご覧ください。
さて、ポストモーテムとレトロスペクティブの違いについての概要を学ぶことができました。当社の新しいレトロスペクティブガイドをご覧になり、あなたのチームの継続的改善のためにレトロスペクティブを定期的に実践する方法をご確認ください。システムやインシデント対応プロセスを持続的に改善する方法について再確認したい場合は、当社のポストモーテムガイドをご覧ください
職場でレトロスペクティブを活用されている方は、PagerDuty Communityに参加して、ベストプラクティスとヒントをシェアしてください。また、職場ではレトロスペクティブを活用していないという場合は、レトロスペクティブがチームや組織に付加価値を提供できるかどうか試してみましょう。そして、当社のコミュニティに参加して経験と学んだことをシェアしてみてはいかがでしょうか。
エンジニアの燃え尽きを防ぐ秘訣とは?
一段と信頼性の高いシステムを顧客が求めるようになり、勤務時間外や夜間の対応など、技術チームへの要求も増しています。本レポートでは、19,000 社以上、100 万人を超えるユーザーで構成されるPagerDutyプラットフォームから収集したデータを基にしたシステム運用の”今”を解説!→ PagerDutyの資料をみる(無料)
目次