ページの本文へ

Hitachi

ソフトウェア

HAモニタ:構成/機能

OSパニック検知

OSパニック検知

カーネルパニックなどOSに障害が発生した場合、HAモニタが検知して系切り替えをします。 OSパニック検知は、OSパニック発生時に従来よりも高速に系切り替えができる機能です。

従来はメッセージの停止を契機に系切り替えをしていたため時間が掛かった

従来、カーネルパニックなどのOS障害は、aliveメッセージという一定間隔で送信されるメッセージを使用して監視していました。実行系からのaliveメッセージが途絶えると、HAモニタは実行系に障害が発生したと判断し、実行系をリセットして待機系に系切り替えをします。この場合、障害が発生してからaliveメッセージが途絶えたと判断できるまでに時間差が生じてしまいます。

OSパニック検知では障害発生とほぼ同時に系切り替えをする

そこでHAモニタは、障害発生からサービス再開までを短縮するために、aliveメッセージではなく実行系と待機系とで直接連絡を取り合い、実行系OSの障害発生とほぼ同時に待機系への切り替えを開始できるようにしました。 この場合、障害が発生した実行系が待機系に通知するだけでよいため、障害発生から検知までの時間差が解消され、サービス再開までの時間が短縮されます。