ページの本文へ

Hitachi

システム運用に役立つ情報を提供システム運用ハック

オブザーバビリティ

監視しているシステムでの問題発生時に
初動対応を自動化する方法

監視しているシステムでの問題発生時に初動対応を自動化する方法

2025年2月28日公開

システムに問題が発生した場合の初動対応を適切に行えないと、影響範囲が拡大したり、重大な障害に発展するリスクがあります。

ここでは、統合システム運用管理 JP1を活用して、エラーイベントが発行されたら初動に必要な処理を行うコマンドを自動実行するための設定方法をご紹介します。

【使用するツール】
JP1/Integrated Management 3 または システム管理 JP1 Cloud Service/System Management
※「システム管理 JP1 Cloud Service/System Management」を利用する場合は、VPN等で接続できる環境で設定していただく必要があります。

1. コマンドを実行する各ホストに、コマンドを実行するためのユーザー設定をする

システム内の各ホストに対してコマンドを実行するには、コマンド実行先の各ホストで、コマンドの実行権限が与えられているJP1ユーザーとホスト上のOSユーザーの対応付けの設定をしておく必要があります。

  1. コマンドを実行する各ホストで、Windowsスタートメニューから[すべてのプログラム]−[JP1_Base]−[JP1_Base Setup]を選択し、[JP1/Base環境設定]ダイアログボックスを表示します。
  2. [ユーザーマッピング]をクリックして表示される画面で、JP1ユーザーとOSユーザーを対応付けます。
  3. [JP1ユーザー]の[追加]をクリックして、JP1ユーザー名とコマンドを実行するサーバーホスト名を設定します。サーバーホスト名に「*」を設定すると、すべてのホストを対象にできます。
  4. [マッピングOSユーザー一覧]の[変更]をクリックして、コマンドを実行するOSユーザーを選択して設定します。

    [マッピングOSユーザー一覧]の[変更]をクリックして、コマンドを実行するOSユーザーを選択して設定します。

2. イベント発行時にコマンドが実行されるように設定する

イベントが発行された契機で自動でコマンドを実行するには、自動アクション機能を使用します。

  1. [イベントコンソール]画面の[メインメニュー]−[オプション]−[自動アクション設定]を選択して、[アクション設定]画面を表示します。

    [イベントコンソール]画面の[メインメニュー]−[オプション]−[自動アクション設定]を選択して、[アクション設定]画面を表示します。

  2. [アクション設定]画面で[追加]または[編集]をクリックして[アクション詳細設定]画面を表示します。
  3. [実行条件]に、コマンドを実行したいイベントを特定するための[イベントID]と[イベント条件]を指定します。
    例えば、重大度が「エラー」のイベントが発生したときにコマンドを実行したい場合は、
    イベントIDで「すべて」を選択、リストボックスで「重大度」を選択、直接指定で「エラー」のチェックボックスをチェックします。
  4. [実行内容]の[実行ユーザー名]にJP1ユーザーを指定し、[実行ホスト名]と[アクション]を指定します。
    アクションには、実行するコマンドや、スクリプト、バッチファイルなどの格納先のフルパスを記載します。
  5. [OK]ボタンをクリックして、[アクション設定]画面を表示します。
  6. [アクション設定]画面の[適用]ボタンをクリックすると、設定内容が更新されます。

    [アクション設定]画面の[適用]ボタンをクリックすると、設定内容が更新されます。

3. 設定したコマンドが実行されるか確認する

実行対象のホストに対して、疑似的にエラーイベントを発生させることで、設定したとおりに、自動でコマンドが実行されるかどうかを確認します。

  1. [イベントコンソール]画面の[コマンド実行]ボタンをクリックして、[コマンド実行]画面を表示します。

    [イベントコンソール]画面の[コマンド実行]ボタンをクリックして、[コマンド実行]画面を表示します。

  2. [コマンド実行]画面で、[コマンド種別]に[管理対象ホストのコマンド]を設定します。
  3. [実行ホスト名]にテスト対象にするホスト名を設定します。
    テストなので、[引き継ぎ情報]の[情報を引き継ぐ]のチェックは外しておきます。
  4. [実行コマンド]の項目には、対象ホストで重大なエラーを発生させるために、以下のコマンドを設定します。
    Windowsの場合:"JP1/Baseのインストール先フォルダ\bin\jevsend" -e SEVERITY=Error
    Linuxの場合:/opt/jp1base/bin/jevsend -e SEVERITY=Error

    [実行コマンド]の項目には、対象ホストで重大なエラーを発生させるために、以下のコマンドを設定します。

  5. [実行]ボタンをクリックすると、ホストAで重大度が「エラー」のイベントが発行されます。イベントが発行されると、[イベントコンソール]画面のイベント一覧の[アクション]に、実行の対象となったマーク([ボタン])が表示されます。

    [実行]ボタンをクリックすると、ホストAで重大度が「エラー」のイベントが発行されます。

  6. [イベントコンソール]画面で、ホストAで発生した重大度が「エラー」のイベントを選択します。

    [イベントコンソール]画面で、ホストAで発生した重大度が「エラー」のイベントを選択します。

  7. [表示]−[自動アクション実行結果表示]を選択して、[アクション結果]画面を表示します。
  8. [アクション結果]画面の[実行結果一覧]に表示されているアクションの[状態]列が「終了」になっていることを確認します。

    [アクション結果]画面の[実行結果一覧]に表示されているアクションの[状態]列が「終了」になっていることを確認します。

システムに問題が発生した場合の初動対応は迅速に行うことが重要です。エラーイベントが発行されたら初動に必要な処理を行うコマンドを自動実行することで、初動対応をもれなく、迅速に行うことができます。

最後までお読みいただきありがとうございました。

記載の仕様は、改良などのため予告なく変更になることがあります。