Hitachi

概要

内蔵ディスクアレイコントローラボード(MegaRAID SAS 3108)でOS稼働中にキャッシュパリティエラーが発生しサーバがハングアップすることがあります。

重要性

重要

現象および影響範囲

MegaRAID SAS 3108上のRAIDコントローラにてキャッシュパリティエラーが発生した際に、サーバ側でBus Uncorrectable ErrorまたはFaultが検出されハングアップすることがあります。クラスタ構成の場合は、フェイルオーバーが発生し待機系に切り替わります。

本現象発生後システム装置をリブートした際に、「HCSM(Hitachi Compute Systems Manager)」、「Hitachi Server Navigator - Log Monitor Logger」に以下のエラーが記録される場合があります。
【記録されるエラーメッセージ】
 1. RS110/210/220,TS10/20の場合
   [日本語版]
   アラートID:0xFD41  アラートレベル:障害
   メッセージ:サーバで障害が発生しました。(指摘部位:Critical Interrupt 発生事象:Bus Uncorrectable Error (**, **))(*1)

   [英語版]
   アラートID:0xFD41  アラートレベル:Error
   メッセージ:On server, an error event occurred.(Part:Critical Interrupt, Event:Bus Uncorrectable Error (**, **))(*1)

 2. RS440の場合
   [日本語版]
   アラートID:0xFD41  アラートレベル:障害
   メッセージ:サーバで障害が発生しました。(指摘部位:PCIe HP Slot1 発生事象:Fault) (*2)

   [英語版]
   アラートID:0xFD41  アラートレベル:Error
   メッセージ:On server, an error event occurred.(Part:PCIe HP Slot1, Event:Fault)(*2)

*1
発生事象/Event内の (**, **) が以下の値の場合、本現象に該当します。(XXは任意の数値)
RS110の場合:(0C,XX)、TS10の場合:(90,XX)、RS210,220/TS20の場合:(00,08) または (01,XX)
*2
指摘部位/Partが PCIe HP Slot1 の場合、本現象に該当します。

回避策

  1. 回避策  :回避策はありません。
  2. 復旧方法 :サーバを再起動することで復旧します。

対策方法

対策版のファームウェアをダウンロードサイトで提供しています。
アップデート後は、サーバの再起動が必要となります。

ファームウェアバージョン:4.220.80-6461 (キャッシュパリティエラー発生時、サーバ停止せず自動復旧するよう対策)

自動復旧時OSシステムログに以下のイベントが記録されます。
【Windowsで記録されるイベント】
 ソース:megasas2 イベントID:11 レベル:エラー
 メッセージ:ドライバーは \Device\RaidPortX でコントローラー エラーを検出しました。

【Linuxで記録されるイベント】
 megaraid_sas: pending commands remain after waiting, will reset adapter scsi0.
 megaraid_sas: resetting fusion adapter scsi0.

【VMwareで記録されるイベント】
 megasas: Found FW inFAULT state, will reset adapter.
 megaraid_sas: resetting fusion adapter

次の日立Webページに対策版のファームウェアを掲載しています。ダウンロードの上、ダウンロードファイル同梱のファームウェアアップデート手順書に従い対策版のファームウェアを適用してください。

 掲載番号:12347088

ダウンロードページより、「キーワード検索」へ移動→装置カテゴリより「HA8000」を選択→「キーワードを入力してください」に「MegaRAID SAS 3108」を入力(*)→「キーワードで検索する」ボタンをクリックし、対象のダウンロードファイルを検索してください。

*
大文字・小文字は正確に入力してください。

対象製品

 
対象製品名 内蔵ディスクアレイコントローラボード(MegaRAID SAS 3108)
対象形名 モデル名 形名
HA8000xNモデル(2016年6月〜モデル)
  • HA8000/RS110 (AN,BN,CN,DN)
    HA8000/NS110 (AN,BN,CN,DN)
  • HA8000/TS10 (AN,BN,CN,DN)
    HA8000/NS10 (AN,BN,CN,DN)
  • GU*110XN-******* (X=A,B,C,D)
  • GU*T10XN-******* (X=A,B,C,D)
HA8000xN2モデル(2016年6月〜モデル)
  • HA8000/TS20 (AN2,BN2,CN2,DN2)
  • GU*T22XN-******* (X=A,B,C,D)
HA8000xN2モデル(2016年4月〜モデル)
  • HA8000/RS210(AN2)
  • HA8000/RS220(AN2),HA8000/NS220(AN2)
  • GU*212AN-*******
  • GU*222AN-*******
HA8000xNモデル(2015年9月〜モデル)
  • HA8000/RS440(AN,CN)
  • GU*440XN-******* (X=A,C)
HA8000xNモデル(2015年4月〜モデル)
  • HA8000/TS20(AN,BN,CN,DN)
  • GU*T20XN-******* (X=A,B,C,D)
HA8000xN1モデル(2015年4月〜モデル)
  • HA8000/RS210(AN1)
  • HA8000/RS220(AN1) ,HA8000/NS220(AN1)
  • GU*211AN-*******
  • GU*221AN-*******
HA8000xNモデル(2014年9月〜モデル)
  • HA8000/RS210(AN)
  • HA8000/RS220(AN)
  • GU*210AN-*******
  • GU*220AN-*******

発生条件

特定の条件はありません。

対象バージョン

ファームウェアバージョン:4.220.80-3991 以前

ファームウェアバージョンの確認方法は、対策版ファームウェアダウンロードファイル同梱のファームウェアアップデート手順書をご参照ください。

対象OS

対象製品がサポートする全OS

更新情報

2017年1月20日 この情報ページを掲載しました。

  • 本ページで記載している内容を予告なく変更することがありますので、あらかじめご了承ください。