このニュースリリース記載の情報(製品価格、製品仕様、サービスの内容、発売日、お問い合わせ先、URL等)は、発表日現在の情報です。予告なしに変更され、検索日と情報が異なる可能性もありますので、あらかじめご了承ください。なお、最新のお問い合わせ先は、お問い合わせ一覧をご覧下さい。
2012年7月24日
新型DNAシーケンサーのビッグデータ解析を加速
株式会社日立製作所(執行役社長:中西 宏明/以下、日立)は、大学共同利用機関法人 情報・システム研究機構 国立遺伝学研究所(所長:小原 雄治/以下、遺伝研)が国際DNAデータベース構築事業を行うためのスーパーコンピュータシステムを構築し、このたび本格稼働を開始しました。
遺伝研は、本システムを活用して、米国・欧州の研究機関などと連携した国際塩基配列データベースの構築と、世界中の研究者に対する公開、研究者が新型DNAシーケンサー*1の出力情報などのビッグデータ解析を加速するためのITリソースの提供を行います。これにより、遺伝研は世界中の研究者による生活習慣病やがんなどの原因解明をはじめ、さまざまな病気の予防、診断、治療に寄与する医学研究や、生物の遺伝学や分子生物学に関わる基礎および応用研究のさらなる発展をサポートしていきます。
遺伝研は、米国立生物工学情報センター(以下、NCBI)により運営されているGenBankおよび、欧州バイオインフォマティクス研究所(以下、EBI)により運営されるEMBL-Bankとの密接な連携のもと、国際塩基配列データベースを構築しています。国際塩基配列データベースは目的や国籍に拘らず閲覧転用できる世界科学の共有財産であり、世界中の研究者はNCBI、EBI、ならびに遺伝研の3つの機関を通じて国際塩基配列データベースに自らの研究データを登録することができます。この国際塩基配列データベースが扱うデータ量は近年爆発的に増加しています。このデータ量増加の背景としては、昨今、ゲノム研究分野での新型DNAシーケンサーの発展が著しく、ヒトゲノムをはじめとした各種生物のゲノム情報の網羅的解析が加速していることがあります。最新の新型DNAシーケンサーでは、断片配列データと呼ばれるDNAの配列を解析単位に断片化したデータが、一回の計測で約60億個(約1.8TB)も生成されます。この新型DNAシーケンサーの登場により、世界中の研究機関で生成される断片配列データ量は爆発的に増加しており、2010年に生成された塩基配列*2の断片データ量はPB(ペタバイト)*3単位となります。さらに、第3世代、第4世代のDNAシーケンサーの発展が予想され今後もデータ量の増加が見込まれます。
このため遺伝研では、スーパーコンピュータシステムを刷新するにあたり、刻々と発生するビックデータの解析を迅速に行うことができるDNA解析計算速度と、ビックデータを迅速に扱えるデータストレージなどのシステム環境を求めていました。また、消費電力の削減も実現したいという希望を持っていました。
日立は、これまでのゲノム分野でのスーパーコンピュータシステムの構築を含めた、さまざまなライフサイエンス関連のシステムでの構築、運用などで培ったノウハウを活用し、DNAシーケンサーから発生するビッグデータの解析を可能とするだけでなく、これまでより省電力で効率的なゲノム解析を実現するスーパーコンピュータシステムを構築しました。
なお遺伝研は2014年に、今回導入したシステムと同等規模以上のシステム増強を予定しています。
今回導入されるスーパーコンピュータシステムでは、新型DNAシーケンサーの登場により発生するビッグデータの高速処理を実現するために必要とされる、超高速アクセスが可能なファイルシステムを実装しています。
具体的な機能として、ひとつのデータを複数のボリュームに分散配置し、並列アクセスを可能としています。これにより、解析サーバは複数のファイルサーバに同時にアクセスして解析処理を行ったり、解析処理した複数のデータを並列に格納処理することができ、処理時間の短縮を実現しています。また、ファイルシステムと解析サーバとを接続するネットワーク装置の理論転送帯域は合計で960Gbpsを確保し、計算処理を行う上で機器間のデータ転送によるボトルネックを回避しています。
今回、本稼働したスーパーコンピュータシステムでは、世界トップレベルの省エネルギー性能を有するラック型空調機を採用しました。ファンによりITラック背面に排出される、サーバから発生した熱は、隣に置かれたラック型空調機により吸気され、前面へ冷気として排出されます。この局所冷却方式は一般的な壁設置型空調機における床下空調方式と比べ、熱だまりが起こりにくく、空調余裕率を抑えることが可能となります。また、日立が独自開発した3次元熱流体シミュレータを活用し、サーバ室内の空調環境についてコンサルティングを行う“「AirAssist(エアアシスト)」サービス”の活用により、計算機と空調機器の最適なレイアウト設計を行いました。データセンターやサーバ室のエネルギー効率を示すPUE*4では、従来1.9であったのが、新システムでは1.2前後となり、効率的な電力消費を実現しています。
株式会社日立製作所 情報・通信システム社 公共システム営業統括本部
カスタマ・リレーションズセンタ [担当:西本、佐々木]
〒136-8632 東京都江東区新砂一丁目6番27号 新砂プラザ
以上