2019年6月12日
株式会社日立製作所
株式会社日立製作所(以下 日立)が提供するデータ統合・分析基盤「Pentaho」と東芝デジタルソリューションズ株式会社(以下 東芝デジタルソリューションズ)が提供するスケールアウト型分散データベース「GridDB®」との間で、このたび、東芝デジタルソリューションズの協力のもと、日立が動作検証を実施し、「GridDB®」が「Pentaho」のデータソースとして利用可能であることを確認しました。これにより、あらゆるビジネスシーンで、データ利活用の可能性が広がることになります。なお、東芝デジタルソリューションズでは、お客さまのニーズに応じて、「GridDB®」と「Pentaho」を組み合わせて提供していきます。
IoTの発展に伴い、企業は多種多様のデータの収集・蓄積が可能になりましたが、蓄積された膨大で複雑なデータの中から、企業の事業戦略に役立つ知見を引き出すためには、データ分析が不可欠です。しかし、このデータ分析のプロセスにおいては、前工程としてデータごとに異なるフォーマットの統一や、データの不備や欠損の補完、データの理解と準備に時間と工数がかかるといった課題がありました。
日立は、データの抽出・変換・出力といったデータ統合機能に特に強みを持つデータ統合・分析基盤「Pentaho」を2015年10月より提供しています。「Pentaho」は、業務システムのデータやセンサーデータ、SNSデータといったさまざまなデータのフォーマットを迅速かつ容易に統一でき、データの不備や欠損を補完するクレンジング機能のほか、データ統合に必要な機能をコーディングレスで提供します。
また、東芝デジタルソリューションズは、産業や社会を支える多種多様なシステムを構築・運用してきた知見・実績を基に開発したスケールアウト型分散データベース「GridDB®」を2013年5月より提供しています。IoTやビッグデータに適した、「IoT指向のデータモデル」「高い性能」「高い拡張性」「高い信頼性と可用性」を特長とし、膨大な時系列データを効率よく蓄積し、高い性能をスケーラブルに発揮できます。
今回の共同検証では、「GridDB®」を「Pentaho」のデータソースとして利用し、「GridDB®」のデータを「Pentaho」のデータ統合機能であるPentaho Data Integrationにより抽出し、データ加工のうえ、再度「GridDB®」に出力できることを検証しました。IoTデータ(センサー、ログ、履歴、株価など)を取り扱うには、分・秒周期、さらにそれ以下の周期で発生する膨大な時系列データを、一貫性や整合性を保った状態で収集・蓄積する必要があります。今回の検証では、この膨大な時系列データの管理に強みを持つ「GridDB®」から「Pentaho」への入力および「Pentaho」から「GridDB®」への出力が正常に処理できることを確認しました。ドラッグ&ドロップの視覚的な操作でデータ抽出・加工・出力することが可能な「Pentaho」と組み合わせることで、さまざまなIoTデータをより簡便にデータ加工し、「GridDB®」に保存するための前工程処理の時間と工数を低減します。
なお、日立と東芝デジタルソリューションズは、今後、データを分析・可視化するデータ分析機能Pentaho Business Analyticsについても動作検証を行なっていく予定です。
記載の会社名、製品名はそれぞれの会社の商標または登録商標です。
株式会社日立製作所サービス&プラットフォームビジネスユニット IoT・クラウドサービス事業部
〒244-0817 神奈川県横浜市戸塚区吉田町292番地
以上