ページの本文へ

Hitachi
お問い合わせお問い合わせ

超高速データベースエンジン Hitachi Advanced Data Binder:機能:効率的なデータ処理

バックグラウンドインポート

Hitachi Advanced Data Binderでは、同一表に対してデータ検索処理と並行してデータ格納処理の同時実行を実現する、バックグラウンドインポート機能をサポートしています。バックグラウンドインポートは、「チャンク*」単位でデータをインポートします。

*
データの格納単位です。表定義(CREATE TABLE)でチャンク適用を指定した表に対してデータを取り込むことで、1回のインポートで取り込んだデータを1つの単位(チャンク)として扱えます。

Hitachi Advanced Data Binder:バックグラウンドインポート例
同一表へのデータ検索とデータインポートの同時実行が可能

バックグラウンドインポートで可能な適用効果

データ格納処理とデータ検索処理の同時実行が可能

以下のようにデータを取り込む頻度が高い場面でも、バックグラウンドインポートを適用し、検索処理を継続できます。

  • データ:センサーデータなどの短時間に発生するデータ
  • データを取り込むタイミング:1時間に1回
  • 検索処理:データインポート中も継続して処理

チャンクアーカイブ

Hitachi Advanced Data Binder では、データ検索ができる状態のまま、データを圧縮してファイルに出力(アーカイブ)することができます。このデータのアーカイブはチャンク*単位で実行しますが、この機能をチャンクアーカイブと言います。

*
データの格納単位です。表定義(CREATE TABLE)でチャンク適用を指定した表に対してデータを取り込むことで、1回のインポートで取り込んだデータを1つの単位(チャンク)として扱えます。

Hitachi Advanced Data Binder:チャンクアーカイブ
データのチャンクアーカイブ化とデータ検索

チャンクアーカイブ適用効果

検索頻度の低くなったデータを保管するストレージのコスト削減

以下のような場面で、チャンクアーカイブが適用できます。

  • データの保存期間:5年(60か月)
  • チャンクに格納するデータ量:1か月分
  • 検索頻度が高い期間:最新1年以内

データのインポート後、1年以上経ち、使用頻度が低くなったデータはアーカイブします。その後データの保存期間が終了後は削除します。

「チャンクアーカイブ」により、検索頻度が低くなったチャンクを圧縮してデータベースの使用容量を削減することで、データのライフサイクルを意識した運用が可能になります。また、データを長期間保管するために必要なストレージのコストが削減できます。

Hitachi Advanced Data Binder:検索頻度の低くなったデータを保管するストレージのコスト削減のイメージ
チャンクアーカイブによるデータのライフサイクル管理

カラムストア

Hitachi Advanced Data Binderでは、同じ列のデータをディスク上に連続して格納するカラムストアに対応しています。ローストアとカラムストアを表定義時に選択できるため、データの用途に合わせた格納形式にできます。

Hitachi Advanced Data Binder:カラムストアのイメージ
ローストアとカラムストアの違いについて

カラムストアによる格納形式を選択した場合の適用効果についてご説明します。

大量データの集計業務を高速化し、分析結果を素早く活用

カラムストアは集計項目のデータだけにアクセスしてディスクへのアクセス量を削減し、大量のデータの集計業務を高速化することで、分析結果をビジネスの現場で素早く活用できます。
また、Hitachi Advanced Data Binderでは、チャンク*1およびレンジインデクス*2を活用することで、特定の月に絞り込んだ集計業務などの部分検索も高速に処理できます。

*1
データの格納単位です。表定義(CREATE TABLE)でチャンク適用を指定した表に対してデータを取り込むことで、1回のインポートで取り込んだデータを1つの単位(チャンク)として扱えます。
*2
レンジインデクスを使用すると、探索条件を満たさない値域のデータを格納しているチャンクの検索処理がスキップされます(チャンクのスキップができます)。

Hitachi Advanced Data Binder:大量データの集計業務を高速化し、分析結果を素早く活用のイメージ
不必要なアクセスはスキップして集計処理を高速化

データ圧縮によるDB容量の削減

データの傾向を分析し、複数の圧縮アルゴリズムの中から最適な圧縮方法を自動的に採用します。ローストアのおよそ1/4〜1/20にデータを圧縮できます*

*
自社環境で測定した結果。圧縮率は表定義やデータによって変動します。

Hitachi Advanced Data Binder:大量データの集計業務を高速化し、分析結果を素早く活用のイメージ
最適な圧縮方法を自動的に採用してデータ容量を削減