公式資料
「デジタルオペレーションの現状」独自調査レポート
エンジニアの燃え尽きを防ぐ秘訣とは?
一段と信頼性の高いシステムを顧客が求めるようになり、勤務時間外や夜間の対応など、技術チームへの要求も増しています。本レポートでは、19,000 社以上、100 万人を超えるユーザーで構成されるPagerDutyプラットフォームから収集したデータを基にしたシステム運用の”今”を解説!→ PagerDutyの資料をみる(無料)
目次
解決までの時間(TTR)または平均解決時間(MTTR)とは、カスタマーサービスの事例やチケットが作成されてから、解決するまでに要する平均時間のことです。お客様やユーザーがサービスに問題を感じてチームに連絡してきた場合、ダウンタイムを最小限に抑えて可能な限り最高の経験を保証するためには、MTTRを最短にすることが重要です。例えば、お客様から電話で製品に関する問題の報告があったとします。TTRはこのやりとりが行われると同時に開始となり、解決に至ると停止します。
TTRは、従業員別やインシデントのカテゴリー別に計算することで、傾向や改善すべきあらゆる領域を明らかにすることができます。お客様ができるだけ中断を受けずにサービスを適切に利用できるように、問題の解決に要する時間を最小限に抑えることを常に目標とすべきです。
「インシデント解決までの時間を短縮するにはどうすればいいんだ?MTTRの数値が足を引っ張っている!」
もしあなたが、この疑問を空に向かって叫んでいるとしても、それはあなただけの問題ではありません。これは慢性的なサポートの問題なのです。インシデント解決までの時間を短縮するにはどうすればいいのでしょうか?結論から言うと、非常に効果的で実用的な方法がいくつかあります。この記事では、その方法をご紹介いたします。
何よりもまず、インシデント解決を評価するために使用される指標について理解し、その指標のどの側面が重要かを決定することが大切です。
解決までの時間にとって最も重要な指標は、もちろん、MTTR(平均解決時間)です。この指標は、分かりやすい簡潔な数値にすべてを凝縮したものであるため、経営陣が好む指標のひとつです。しかし残念なことに、そうした数値は単純すぎて、重要な情報が排除されており、ほぼ無意味な平均値でしかないことがあります。
全体的なMTTR(すべてのインシデントを対象としたもの)は、データに影響を与える異常値がそれほど多くなく、釣鐘曲線の下にうまく収まる広範囲のインシデントに基づいているのであれば、信頼できる指標になります。しかし、2つの異なるインシデントが存在し、それぞれの解決時間が大きく異なっているとしたら、そのMTTRに基づいた判断は誤っている可能性があります。広範囲の釣鐘曲線は異常値を含むことが多いため、システム全体のMTTRは良い指標ではないかもしれません。
指標を選べるとしたら、全体的なMTTRの代わりとなるものは何でしょうか?次にいくつかご紹介します。
ID部門 | 1ヶ月の インシデント数 | 目標時間を超過した インシデント数 | 累積インシデント時間 | 目標時間を超過した インシデントの割合 | MTTR |
A | 3 | 1 | 4.5時間 | 33.33% | 1.5時間 |
B | 35 | 10 | 26.25時間 | 28.57% | 0.75時間 |
しかし、解決時間を測定しても、数字を低く抑える必要性(たいてい経営陣からの圧力を伴う)に変わりはありません。どうすればいいのでしょうか?
取るべきいくつかのステップがありますが、それらを一緒に取り組むことで、ポジティブな成果を得ることができます。以下は、今すぐ始めるべき6つの重要なステップです。
レスポンスタイムを短縮するために実行できるステップは他にもたくさんあります。例えば、大企業にとっては、インシデントドリルを用いた組織的なコマンドシステムが適切かもしれません。しかし、上記のガイドラインに従うことで、ITチームのMTTR数値を、空に向かって叫びたくはならない程度に下げられるはずです。
▼こちらの記事もおすすめ
> システム障害を未然に防ぐ「インシデント管理」とは?
> インシデント対応とは?事例から読み解く対策方法
エンジニアの燃え尽きを防ぐ秘訣とは?
一段と信頼性の高いシステムを顧客が求めるようになり、勤務時間外や夜間の対応など、技術チームへの要求も増しています。本レポートでは、19,000 社以上、100 万人を超えるユーザーで構成されるPagerDutyプラットフォームから収集したデータを基にしたシステム運用の”今”を解説!→ PagerDutyの資料をみる(無料)
目次