インシデント管理:サービスを回復させ、影響を最小限にします

ITILにおけるインシデントとは、「ユーザーが正常にサービスを受けることができない状態、もしくはそうなる可能性が高く、何らかの緊急対応が必要な出来事」のこと指しています。このようなインシデントが発生したときに、できる限りすばやく正常なサービスに回復させ、ビジネス上の悪影響を最小限にとどめるための対応活動を行うのが、「インシデント管理」なのです。

これにより、サービス提供者側は「正確で迅速、かつ効率のよい対応を提供することにより顧客満足度の向上」が、サービス利用者側は「正確で迅速、かつ効率のよい対応を受けられることによる安心感」というメリットを享受することができます。

導入にあたっては、以下に挙げる活動から構成される「インシデント・ライフサイクル」と呼ばれる流れに沿って実施されます。

活動 内容
検出および記録 ユーザーからの連絡や監視ツールからのアラート(警告)などからインシデントの発生を検知して、データベースなどに記録します。
分類・サポート 検知したインシデントをハードウェア、ソフトウェアなどの発生種類やビジネスに対するインパクトおよび優先度などによって分類し、過去の記録やナレッジデータベースなどを参照します。
調査・診断 ト解決に向けて、専門家による高度な分析が行われます。前の活動で適切に分類できなかったり、解決できなかったものはサポート・グループに解決が委ねられます。具体的な処置として「インシデントとの詳細の評価」、「関連する全ての情報の収集と分析、および解決」、「n次サポートまでの回送」を行い、解決します。
解決・復旧 解決策の実行、復旧措置を行います。次のステップに備えて、解決・復旧活動中のイベントや処置は適切に記録をとる必要があります。
クローズ 解決策が実行されたら、ユーザーに対して、解決されたかどうかを確認します。解決したと確認できた場合は、最新のインシデント情報を記録した上でインシデントをクローズ(完結)します。

ITILには「問題管理」というプロセスがあります。問題管理では問題を完全に解決することを目標にします。問題の解決を優先するプロセスなので、時間をかけて根本原因を追究し、恒久的な解決策を策定します。

一方、インシデント管理の目標は一刻も早くサービスを復旧させることです。時間を優先するプロセスなので、根本原因を解決する目処が立たない場合などは、ITサービスを使わないマニュアル作業なども含めたワークアラウンドで対応します。これが問題管理との大きな違いです。