を14日間無料で試してみる
700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。
いまや、ITは社会全体で必要不可欠なものとなっていますが、ITの重要性が高まるにつれて、リスク管理の必要性も増しています。経営者のなかには「なぜリスク管理が必要なのか?」「そもそもリスク管理とは?」という疑問をお持ちの方もいらっしゃるのではないでしょうか。
また「運用しているシステムのリスク管理は万全か?」「Webサービスでシステム障害が起きた場合はどう対応すべき?」と、不安を抱いているエンジニアの方もいらっしゃるでしょう。
ITリスク管理は、リスクの発生を未然に防ぐため、またリスクが発生した際に被害を最小限に抑えるために必要とされています。本記事を読むことで、ITリスク管理の実施手順や成功させるためのポイントがわかります。経営者や運用担当の方は、ぜひ参考にしてください。
目次
「リスク管理」とは、想定されるリスクを未然に防ぐことです。企業経営におけるリスク管理とITリスク管理、それぞれの概要について解説します。
経営者は、リスク管理を常日頃から意識し、どのような事態が企業に起きても適切に対応できるようにすることが必要です。リスク管理を行なうことで企業の価値を維持でき、機会損失の回避にもつながります。
またリスク管理は、万が一問題が発生した際に事業を継続できるようにするためにも必要です。リスク発生の頻度や影響度を把握し管理することで、適切に対策を立てられます。
システム運用の現場で、エンジニアが行なうリスク管理が「ITリスク管理」です。社会全体でITに依存する割合が増えた昨今、システムの安全性を確保することが重要視されています。そもそもリスクを発生させないのが理想ですが、システム運用にはリスクがつきものです。そのため、起こりうるリスクを事前に炙り出し、どう対処するのかを決めなくてはなりません。異変が起きた際に迅速に察知するのが、ITリスク管理の目的です。
本記事では、ITリスク管理に焦点をあてて解説していきます。
企業にとってITリスク管理が必要な理由を、経営層と現場層に向けて、それぞれ解説します。
「企業経営」においてITリスク管理が必要な理由は、次のようなものがあります。
このような状態を未然に防ぐためにも、ITリスク管理は必要になります。
システム運用の現場においてITリスク管理が必要な理由は、次のようなものがあります。
ITリスクには、大きく4つの種類があります。それぞれの特徴は次のとおりです。
セキュリティリスクのなかでも代表的なものの一つとされるのが、ランサムウェア(不正プログラム)によるサイバー攻撃です。ハッキングによる不正アクセスや情報漏洩、ウィルスに起因するシステム停止もセキュリティリスクに該当します。
パスワード入力ミスなどのヒューマンエラーは、人的リスクに該当します。特にメール誤送信やUSBメモリ紛失をきっかけとする情報漏洩は、大きな被害を招くことが考えられます。その他、関係者による内部不正も人的リスクの一つです。
地震や台風、洪水などの自然災害は、ITシステムにとって脅威となります。例えば、地震や落雷の影響によってシステムが停止する恐れがあります。台風や豪雨によって浸水した場合は、機器の故障もありえるでしょう。
また、道路が通行止めになったり、交通機関が止まったりしたことにより社内の人員が不足するケースも、自然災害リスクに該当します。
OSやアプリケーションなどソフトウェアの不具合による障害も、ITリスクの一つです。ソフトウェアのバグなどが該当します。サーバーなどハードウェアの障害も、ITリスクの要因になります。製品の不良や経年劣化によっても、物理的な破損が生じやすくなるでしょう。
システムの運用現場における、ITリスク管理のプロセスを解説します。ITリスク管理は、次のように4段階に分けて行なわれます。
ITシステムの脆弱性を把握し、過去の事例を振り返って今後起きそうなリスクをリストアップします。リスク発生やリスク対応に関連する部署で会議やヒアリングを行ない、分析を進めましょう。
洗い出したリスクの危険度を評価して、対応の優先順位を決めます。限られたリソースを有効活用するためには、順位付けが大切です。優先順位を決めるには、リスクが「発生する確率」と「影響の度合い」を軸にしましょう。そして、発生する確率と影響度が高いリスクから対応します。
決定した優先順位に沿って、リスク対策のプランを立てましょう。その際には、優先順位ごとに回避・軽減・転嫁・受容の4つに分けて考えることをおすすめします。確実に回避できないリスクは軽減する方法がないかを考え、事業運営に影響が出そうなリスクには早めに対応することが大切です。
すべてのリスクへの対応が終わったとしても、ITリスクの内容は常に変化し続けるため、リスク管理は終了しません。場合によっては、優先順位の変更や対応するリスクの追加も必要になるでしょう。さらに、事業の状況によっては、対応せずに済むリスクが出てくるかもしれません。
常に最新の状況に沿って判断できるよう、リスクモニタリングを継続することが必要です。
ITリスク管理を成功させるための重要なポイントを5つ解説します。
ITリスク管理において、原則として発生確率と影響度の高いリスクは、優先順位も高くなります。ただし、企業によって優先すべき事項は違うため、社内で議論して方針を決めることが大切です。影響度が中程度のものでも、すぐに対応が可能であれば優先しても構いません。発生確率は低いものの影響度の高いリスクであれば、そちらも優先的に対処しましょう。すべてのリスクに対応するのは現実的に不可能なため、優先順位を見極めることが大切です。
前述のとおり、すべてのリスクに対応することはできないため、完璧を求めすぎると途中で頓挫しかねません。優先順位や重要度を見極め、現実的に継続可能なレベルでリスク管理を行なうことが大切です。
リスク管理を行なう際は「リスク対リスク」の視点を持つことが大切です。リスク対策を行なったつもりでも、別のリスクを引き起こす原因となる場合があり、このようなケースを「多重リスク」と呼びます。例えば、ITリスクの場合、セキュリティー対策とプライバシー対策は両立できず、相反することがあります。新たに発生するリスクを許容できなければ、違う対処法を検討しましょう。
ITリスク管理を行なう際には、関係者(ステークホルダー)同士でリスクコミュニケーションを取ることも大切です。関係者同士でリスクに関する情報を共有し合うことで、方針の決定に役立ちます。特に、起こるかわからない不確実性の高いリスクに対応するには、関係者同士で落としどころを決めなくてはなりません。そのため、コミュニケーションリスクが重要になります。
ITリスク管理を行なう際には、リスクをリアルタイムで発見することも重要になります。これは、リスク発生のダメージを最小限にとどめ、迅速に対応するためです。
しかし、自社ですべてをまかなうにはコストと人員が必要になるため、対応できる人員が不足している場合は、ITリスク管理の専用ツールで補うとよいでしょう。専用ツールを使用すれば、データ分析や従業員への周知など、ITリスク管理において必要な業務の効率化や自動化が可能になります。
前述したように、ITリスク管理の実施には、継続的なリスクモニタリングが必要です。常時モニタリングすることで、早期の異常検知が可能になり、システム障害の未然防止につながります。インシデント管理ツールPagerDutyを導入すれば、異常検知の効率化が可能です。PagerDutyは、700以上のツールと連携し、システム障害を自動的に検出・診断できます。対応すべきインシデントだけを特定して適切なメンバーに通知できるため、初動対応の高速化やエンジニアの負担軽減が期待できるでしょう。
関連記事:異常検知とは?~発生しうるリスクと検知を行う際のポイント~
「PagerDuty」の詳しい資料を見てみる
株式会社NTTドコモ様は、アラートの集約と精査に対する課題を抱えていました。NOCへのアウトソースやアラート対応の手順書作成などに、多くの時間と労力がかかる状態となっていたのです。そこで、PagerDutyを導入して複数のツールからのアラートを集約させたところ、月に10,000件もあったアラートが1,000件程度に減少しました。
また、PagerDutyでインシデント対応を行なうことにより、MTTA(平均確認時間)は数時間から3~5分に減少、MTTR(平均修復時間)も数日だったところから2時間15分への減少を実現しています。このように、クリティカルなアラートへの対応時間を、月40時間程度削減できました。アラートの集約・精査が可能になったことで、本当に必要なアラートだけを受け取れるようになり、新規プロジェクトではNOCレスな運用監視を基本とする方向へと動き出しています。
NTTドコモ様事例
インシデント対応の変革で手作業を自動化 NOCレスな運用監視も新たな選択肢に
NEC(日本電気株式会社)様では、社内で約1,000ものシステムを稼働させています。以前は、膨大な数のシステムから出されるアラートを、すべて手作業で処理していました。そのため、アラートの精査に時間がかかり運用管理の質が低下する点や、担当者の負担が大きく、時間とコストを消費する点が問題となっていました。
そこで、インシデント対応における手作業や反復作業の自動化のために導入したのが、PagerDutyです。その結果、膨大な数のアラートから、システム障害につながるアラートのみを自動的に切り分けられるようになりました。これにより、アラート数が約70%も減少し、対応が必要なインシデントに対しては、自動的に適切なメンバーがアサインされるようになりました。
NEC様事例
インシデント対応における人の介在を最小化 本業にフォーカスして人ならではの付加価値を創出
ITが必要不可欠な存在となった昨今、企業においてITリスク管理が重要となっています。ITリスクの種類には、セキュリティリスクや人的リスク、自然災害リスクなどがあります。企業が提供するサービスでシステム障害が起きると、顧客離れや経営危機につながりかねません。そのため、さまざまなITリスクに備えられるよう、優先順位を見極めて適切にITリスク管理を行なうことが大切です。記事内では、ITリスク管理を成功させるポイントとして専用ツールの導入を紹介しましたが、ITリスク管理の効率化にはインシデント管理ツールの導入もおすすめです。インシデント管理ツール「PagerDuty」を使えば、システム障害が起きた際にも迅速に対応できるようになります。
700以上ものツールと連携。システム障害を自動的に検出・診断するだけでなく、適切な障害対応メンバーをアサインし、デジタル業務全体の修復ワークフローを自動化します。
目次