を14日間無料で試してみる
700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。
PagerDutyの年次カンファレンス「PagerDuty on Tour TOKYO 2024」が8月6日(火)にリアルイベントとして都内で開催されました。ニューヨーク、サンフランシスコ、ロンドン、シドニー、東京の5都市で開かれるグローバルイベントの一つで、東京が最後の開催地でした。昨年も同様のイベントをビジネスセッションとエンジニアセッションの2部構成で開催しましたが、昨年よりも参加者が2倍になっただけでなく、内容もさらに濃くなり、システム障害対応に対する関心の高さが感じられるイベントとなりました。
展示エリアでは、パートナー各社からご来場の皆さまに各社のサービスをご紹介いただきました。ちなみに、PagerDutyのマスコット「ペイジー」も来場者の方々と記念写真撮影を行い、交流を深めていました。
PagerDuty on Tour TOKYO 2024の開催レポート第一弾では、ビジネスセッションの前半として、内容をレポートいたします。
目次
イベントはPagerDuty株式会社 代表取締役社長の山根伸行が開会挨拶として登壇し、2009年にサンフランシスコで創業したPagerDuty自身や、今年2年目となる国内事業では400社弱のお客様にご利用いただいている状況などを紹介しました。
そんなPagerDutyが最近真価を発揮した出来事が、7月19日に発生した、セキュリティソフトの不具合による世界的なシステム障害でした。PagerDuty調べでは、システム障害発生のピーク時には国内外において通常よりも3倍多いインシデントが発生したものの、PagerDutyのお客様の障害対応時間は29%増にとどまりました。
山根は、不測の事態に備えることが重要性を語り、インシデント対応においてPagerDutyでどう対応できるかという観点から、今回のカンファレンスを聞いていただきたいと挨拶しました。
1つめの基調講演には、株式会社JR東日本情報システム(JEIS)の吉川眞之氏(取締役、Suica・駅サービスソリューション本部長)にご登壇いただき、PagerDuty CEOのジェニファー・テハダとの特別対談を行っていただきました。JEISは、JR東日本の情報システムの開発と運用を行う会社で、「きっぷ、旅の予約」から、「駅・旅行に関する案内」まで、鉄道を中心とした様々なサービスを提供する「えきねっと」にてPagerDutyを利用されています。
サービス開始から20年を越し多くの方々に利用される「えきねっと」では、特にお盆の時期などに予約が集中する期間においても、安定的なシステム稼働が求められます。そこに課題感をもたれていた吉川氏がPagerDutyを知り、サンフランシスコ本社にて製品担当のシニア・バイス・プレジデントをはじめとするエグゼクティブたちと直接対話する機会を設けたそうです。これらの対話から、アラートが発生した時、「いかに早く対応するか」「いかに早く復旧させるか」という要求に適しているということが、決め手となりPagerDutyの導入を決定されたそうです。新幹線の予約は、ゴールデンウィーク、お盆、年末年始の年3回にスパイクが起き、そこで問題があるとJR東日本もさることながら、社会にとっても大きなダメージとなってしまします。そこで、適切な担当者にアラートが秒単位で届けられるPagerDutyの役割が非常に影響が大きいと語られました。
JR東日本のシステムの今後については、レガシーなシステムを作り替えていくことと、運用をマニュアルオペレーションから自動化へと移行していくことも語られました。そのほか、「7月19日の世界規模のシステム障害」の影響(主だったサービスにはほぼインパクトなし)や、リーダーとしてチームの価値観やビジョンを共有することの重要性などもお話いただきました。
2つめの基調講演では、PagerDuty最高製品開発責任者(Chief Product Development Officer)のジェフリー・ハウスマンが、「AIと自動化が実現するオペレーショナル・エクセレンス」の題で、新機能の発表とプロダクトについて語りました。
冒頭では「7月19日の世界規模のシステム障害」について、PagerDutyのプラットフォーム上では、通常の3倍の通知と15倍のインシデントワークフローが発生していたことを紹介しました。このような状況に対して、PagerDutyのお客様の対応時間は、通常に対して29%増えただけだったことを共有しました。
それを踏まえて、障害は「もし、起こったら」ではなく、「いつ起こるかという問題」であることや、システム運用のレジリエンスは経営層の問題であること、さらにこれらの問題解決には運用のモダン化が必要であることを語りました。
PagerDuty Operations Cloudがこうした運用の変革をどのように実現させるのでしょうか。その機能の一つである生成AIソリューション「PagerDuty Advance」の一般提供開始が発表されました。さらに、8月28日から日本語対応がベータ版として提供開始、9月30日には一般提供が予定されていることも発表しました。
PagerDuty Advanceでは、Slackで生成AIがインシデントについてインサイトを提供する機能や、インシデント解決後のポストモーテム(事後検証)の自動生成機能などもあります。また、6月に発表された「PagerDuty Operations Console」について、イベント当日はベータ版ですが、数週間のうちに一般提供を開始することも発表しました。ネットワークオペレーションセンター(NOC)での利用を想定しているPagerDuty Operations Consoleは、リアルタイムでリフレッシュされるダッシュボードにインシデント情報を一元化します。柔軟なフィルター機能なども備えるので、必要な情報を即座に発見しやすくなります。
そのほか、2023年11月のJeli買収によってPagerDuty Operations Cloudに加わった、インシデント分析の「Narrative Builder」についても紹介し、エンドツーエンドでインシデントの記録を残すことで、再び大きなインシデントが起きたときの負担を減らし、検証できることを説明しました。
また、PagerDutyの国内事例として、NECでは85%のアラートノイズを削減、NTTドコモではアラートを10,000件から1,000件へと削減したこと、さらにシンプレクスではサービスデスクの業務工数が1/10になり、人件費が36%削減されましたことなどを紹介しました。
8/6(火)に開催したカンファレンス「PagerDuty on Tour TOKYO 2024」で大好評を博したセッション「AIと自動化が実現するオペレーショナル・エクセレンス」を振り返ります。イベント当日は英語解説でしたが、今回は特別に日本語で講演内容のエッセンスを分かりやすく解説します。ぜひ奮ってご参加ください!
https://www.pagerduty.co.jp/event/20240820-webinar/
700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。
目次