BS320の外付けSASストレージ接続構成においてVMware(ESX4.x)環境で使用されており、かつI/Oが高負荷のケースで以下の現象が発生します。
《現象1》 BS320に接続されたBR1200のコントローラ閉塞が発生する。
《現象2》 複数台のブレードサーバでシステムハングアップが発生する。
《現象3》 BR20/BR1200のコントローラAとコントローラB間でパス切り替えが頻発する。
VMware(ESX4.x)の標準インストール状態では、OSからSMPコマンド(*)が定期的に発行されます。一方I/Oが高負荷でコマンドタイムアウトする状況では、SASインタフェース上でリンクリセットが発生する場合がありますが、これを契機に接続されているサーバおよびBR1200から一斉にSASスイッチに対しSMPコマンドが発行されます。複数台のVMware ESXおよびリンクリセット契機のSMPコマンドが同時に発行された場合、SASスイッチのSMPコマンド処理がBusy状態となり、SMPコマンドの応答が規定時間内にできず、BR1200のコントローラ閉塞、サーバのハングアップ、パスの切り替わり頻発に至ります。
BS320の外付けSASストレージ接続構成においてVMware (ESX4.x) 環境で使用されており、かつI/Oが高負荷の場合。
■対策に関する情報
<回避方法>
VMware (ESX4.x) からのSMPコマンドの定期的な発行を抑止することで、規定時間内にSMPコマンドを処理できるようになります。このため、ハードウェア監視サービスプログラム (sfcbd) の停止およびESX起動時に自動起動しない設定をお願いします。
以下3つのコマンドをrootで実行します。
# service sfcbd-watchdog stop
# chkconfig sfcbd-watchdog off
# chkconfig sfcbd off
サービスの停止を、以下のコマンドを実行し"stopped"と表示されることで確認してください。
# service sfcbd-watchdog status
stopped
以下のコマンドを実行し、0〜6まで全てoffになっていれば、当該サービスはESX起動時に自動起動しない設定となっています。
# chkconfig sfcbd-watchdog --list
sfcbd-watchdog 0:off 1:off 2:off 3:off 4:off 5:off 6:off
詳細は以下をご確認ください。
2013年09月03日 この情報ページを公開しました。