Hitachi

概要

HA8000/RS220xN,N1, RS210xN,N1, TS20xN, RS220/RS220-s/RS220-hxM2, RS210/RS210-hxM2, RS110-hxM2, TS20xM2, TS10-hxM2モデルおよびBS500 BS520HB3モデル、BS2500標準サーバブレードA1モデルにおいて、Intel® VT-dもしくはC Stateが有効な場合、VMware vSphere ESXiにてPSOD(パニック)が発生することがあります。
内容をご確認の上、発生条件に該当する場合は、対策方法、または回避方法の適用をご検討いただきますようお願いいたします。

対象製品

モデル 形名
HA8000/RS220xN,N1 GU*220*N-*******, GU*221*N-*******
HA8000/RS210xN,N1 GU*210*N-*******, GU*211*N-*******
HA8000/TS20xN GU*T20*N-*******
HA8000/RS220/RS220-s/RS220-hxM2 GQ*222*M-*******
HA8000/RS210/RS210-hxM2 GQ*212*M-*******
HA8000/TS20xM2 GQ*T22*M-*******
HA8000/RS110-hxM2 GQ*112HM-*******, GQ*112KM-*******
HA8000/TS10-hxM2 GQ*T12HM-*******, GQ*T12KM-*******
モデル 形名
BS500 BS520HB3 GG*GC0B3-*******
BS2500標準サーバブレードA1 GV*HC0A1-*******

重要性

注意

現象

対象製品において、Intel® VT-dもしくはC Stateが有効な場合、VMware vSphere ESXiにてPSOD(パニック)が発生することがあります。
PSOD(パニック)が発生するとコンソールがパープルスクリーンになり、次のようなメッセージが表示されます。「PCPU XX locked up. Failed to ack TLB invalidate.」というキーワードが入っている場合に、本事象に該当する可能性があります。

*
XXには数字が入ります。

(出力例)
VMware ESX ESXi 5.5.0 [Releasebuild-1331820 x86_64]
PCPU 30 locked up. Failed to ack TLB invalidate (total of 1 locked up, PCPU(s): 30).
Code start: 0x418034200000 VMK uptime: 218:02:50:04.600
Saved backtrace from: pcpu 30 TLB NMI
0x41251485d930:[0x4180342a4114]TimerGetPTSCCycles@vmkernel#nover+0x3c stack: 0x0
0x41251485d990:[0x41803429ba09]SP_WaitLockIRQ@vmkernel#nover+0x101 stack: 0xa6fa76380f64c7
(・・・略・・・)

発生条件

<発生条件1>Intel® VT-dが有効な場合

対象製品において、次の条件のすべてに該当する場合に、本現象が発生することがあります。

  • Intel® VT-dが有効である。
  • 対象製品BIOS/サーバブレードファームウェアバージョンが下記該当バージョンである。
モデル 該当バージョン
HA8000/RS220xN,N1, RS210xN,N1 5.0.8022未満
HA8000/TS20xN 5.0.3008未満
HA8000/RS220/RS220-s/RS220-hxM2 全バージョン
HA8000/RS210/RS210-hxM2
HA8000/TS20xM2
HA8000/RS110-hxM2
HA8000/TS10-hxM2
モデル 該当バージョン
BS500 BS520HB3 サーバブレードファームウェア08-48未満
BS2500標準サーバブレードA1 サーバブレードファームウェア08-48未満

<発生条件2> C Stateが有効な場合

HA8000/RS220xN,N1, RS210xN,N1において、発生条件1非該当の最新システムBIOSを使用している場合でも、次の条件に該当する場合、本現象が発生することがあります。

  • 対象製品 HA8000/RS220xN,N1, RS210xN,N1
  • システムBIOSの設定項目「Power Management Policy」が「Energy Preferred」もしくは「Custom」である。「Custom」の場合には、「Processor C3 Report」と「Processor C6 Report」のどちらかが「Enabled」もしくは、「Package C State Limit」が「C0/C1」以外である。

対策方法

<発生条件1の対策方法>

HA8000/RS220xN,N1, RS210xN,N1, TS20xNモデルにつきましては、HA8000ドライバダウンロードサイトより提供しております、最新のシステムBIOSへのアップデートをお願いします。

モデル 対策バージョン
HA8000/RS220xN,N1, RS210xN,N1 5.0.8022
HA8000/TS20xN 5.0.3008

以下のダウンロード検索ページより、「装置」は「HA8000」を、「機種名」、「世代」はご使用の装置を、「カテゴリ」は「BIOS[システム装置]」を選択いただき、最新のシステムBIOSダウンロードをお願いします。

ブレードサーバBS500 BS520HB3、BS2500標準ブレードA1につきましても、BladeSymphonyドライバダウンロードサイトより提供しております、最新のサーバブレードファームウェアへのアップデートをお願いします。

モデル 対策バージョン
BS500 BS520HB3 サーバブレードファームウェア08-48
BS2500標準ブレードA1 サーバブレードファームウェア08-48

以下のダウンロード検索ページより、「装置」は「BladeSymphony」を、「機種名」、「世代」はご使用の装置を、「カテゴリ」は「ファームウェア」を選択いただき、最新のサーバブレードファームウェアのダウンロードをお願いします。

HA8000/RS220xM2, RS210xM2, TS20xM2, RS220-sxM2, RS220-hxM2, RS210-hxM2, RS110-hxM2, TS10-hxM2モデルは、対策版システムBIOSの提供がございませんので、回避方法による対応をお願いします。

<発生条件2の対策方法>

発生条件2は、回避方法による対応をお願いします。

回避方法

<発生条件1の回避方法>

ESXiでIntel® VT-dの割り込み再マッピング機能を無効化することで、本現象を回避できます。

割り込み再マッピング機能を無効化する場合(ESXi 5.0、5.1、5.5、6.0の手順)

  1. SSHまたはコンソールを使用し、ESXiホストにrootユーザでログインします。
  2. 次のコマンドを使用して、ホストでの割り込み再マッピング機能を無効に設定します。

       # esxcli system settings kernel set --setting=iovDisableIR -v TRUE
    
    
  3. ホストを再起動します。
  4. ESXiホストにログインし、次のコマンドを実行してRuntimeがTRUEになっていることを確認します。

       # esxcli system settings kernel list -o iovDisableIR
       
       Name          Type  Description                              Configured  Runtime  Default
       ------------  ----  ---------------------------------------  ----------  -------  -------
       iovDisableIR  Bool  Disable Interrrupt Routing in the IOMMU  TRUE        TRUE     FALSE
    

割り込み再マッピング機能を無効化した時の性能影響

ハードウェアでの命令の直接実行ができなくなるため、性能に影響がでる場合があります。ただし、無効化した場合の性能影響の指標はありません。
そのため、機能を無効化する場合は事前に検証をした上での本番運用をお願いします。

<発生条件2の回避方法>

システムBIOSの設定項目にてC2/C3/C6 Stateを無効化することで、本現象を回避できます。

  1. システム装置の電源を入れます。
  2. システム装置の起動中、画面左下に「Press <F2> SETUP, <F4> ROM Utility,<F12>Network」と表示されたら、[F2]キーを押します。しばらくしてセットアップメニューが起動し、Main(メインメニュー)が表示されます。
  3. 「Advanced」の位置にカーソルを移動し、Advanced メニューを表示します。
  4. 「Processor Configuration」を選択し、[Enter]キーを押します。
  5. 「Processor Power Management」を選択し、[Enter]キーを押します。
  6. 「Power Management Policy」の設定値を確認します。
    「Performance Preferred」であれば、既にC Stateは無効です。以降の設定変更作業は不要ですので、セットアップメニューを終了してください。
    「Energy Preferred」であれば、「Custom」を設定してください。
  7. 「Processor C3 Report」と「Processor C6 Report」の設定値を「Disabled」に、「Package C State Limit」の設定値を「C0/C1」に設定してください。
  8. 「Save & Exit」の位置にカーソルを移動し、Save & Exit メニューを表示します。
  9. 「Save Changes and Exit」を選択し、[Enter]キーを押します。自動的に再起動します。

セットアップメニューの操作方法については、システム装置に添付されているマニュアルをご参照ください。

C Stateを無効化した時の性能影響

C StateおよびTurbo Boostが有効なシステムにおいて、プロセッサ・コア間の負荷状態に偏りがある場合、ESXiがアイドル状態のプロセッサ・コアを低電力状態にすることで、一部の高負荷状態のプロセッサ・コアの最大周波数がTurbo Boost機能により定格周波数から引き上げられます。低電力のC Stateを無効化すると、Turbo Boost機能による引き上げ幅が制限されます。 このため、性能に影響がでる場合があります。ただし、無効化した場合の性能影響の指標はありません。
機能を無効化する場合は事前に検証をした上での本番運用をお願いします。

発生時の対処

PSOD(パニック)が発生するとコンソールがパープルスクリーンになりメモリダンプの採取を開始しますので、次の手順でシステムを再起動してください。

  1. 画面下部に「"Escape" for local debugger」というメッセージが表示されるまで待ちます。
  2. メッセージが表示されたら[Esc]キーを押してコンソール画面に切り替えます。
  3. "reboot"と入力して[Enter]キーを押します。
  4. ESXiが再起動されますので、通常運用とおりシステムを起動します。

更新情報

2018年02月09日 <発生条件2>およびその回避方法についての記述を更新しました。
2016年05月27日 この情報ページを掲載しました。

  • 本ページで記載している内容を予告なく変更することがありますので、あらかじめご了承ください。