データ統合の開発基盤（ETLツール） DataStage：機能紹介：DataStageの機能紹介

開発前準備
開発
確認・テスト
リリース
本番
保守・拡張

DataStageは、企業内に散在する膨大で多種多様なデータを、ビジネスに活かせる情報に変換できるデータ統合の開発基盤(ETLツール)です。既存システムのデータを抽出し、自由にデータを加工した後、ターゲットに格納する処理を視覚的に開発することができます。

DataStageの開発イメージ

DataStageではジョブ開発を効率よく行うためにプロジェクト内でジョブを管理し、チームで分担開発するための多様なプロジェクト管理機能をご用意しています。例えば、次のようなものがあります。

プロジェクトの追加・削除
プロジェクト内の開発物をエクスポート、他プロジェクトにインポート
OSのユーザーやLDAPで管理しているユーザーによる認証^*1
プロジェクトに対する管理者、開発者、オペレータなどのアクセス権限の振り分け
他ユーザが開発中のジョブをReadOnlyで参照可

これらの機能により、大規模な共同開発に対応できます。

*1: V08-50からOS／LDAPとDataStageとのユーザ情報一元化が可能になりました。

* LDAP：Lightweight Directory Access Protocol

ページの先頭へ

開発前準備－様々なデータを活用

テーブル定義の取り込み

データベースのディクショナリ、COBOL COPY句、XMLファイルなどのテーブル定義情報を取り込むことができます。

* XML：eXtensible Markup Language

テーブル定義の取り込み

ページの先頭へ

開発－データ統合処理をビジュアルに開発

簡単操作によるデータ加工処理の実装

データ抽出・変換・集計などのデータ統合処理のジョブを、ドラッグ＆ドロップとパラメータ設定の簡単なGUI操作で開発します。特にデータ加工処理では、データの突き合わせ、重複削除、集計、ソート、コード変換、クレンジングなどの部品や関数を豊富に提供。
データの流れを視覚的に把握しながら、データ加工処理を効率よく開発することができます。

* GUI：Graphical User Interface

開発画面

豊富なデータ加工処理部品を標準提供

データの条件分岐や重複削除、ファイル間の差分抽出、スタースキーマの更新データ作成など、高度な加工処理のための部品を標準で提供。ユーザーが独自に関数を作成して使用することもでき、複雑なデータ加工にも対応します。

豊富なデータ加工処理部品を標準提供

多様なデータ入出力機能

HiRDB、Oracle、Db2、Microsoft® SQL Serverなど、各種DBに対応。各種DBのローダを利用した高速ロードも可能。各種DBのローダにあわせて制御ファイル、データファイルを自動生成し、実行します。JDBCインタフェースもサポートし、幅広いDBを利用できます。
文字コードセットを変換する機能を標準で持っており、メインフレーム系、オープン系など多くの日本語文字コードセット変換、各種システムのデータ連携・統合が可能です。
また、XMLデータ、Java™ プログラム連携、Webサービス連携にも対応し、幅広いデータを扱うことが可能です。

ページの先頭へ

確認・テスト－ジョブの実行・モニタリング

ジョブのコンパイル

GUI画面で作成したデータ統合処理のジョブ定義をコンパイルし、実行可能な状態にできます。

ジョブの実行・停止

GUIによる簡単な操作でジョブの起動・停止が可能。また、ジョブは標準コマンドインターフェースから呼び出すことが可能なため、外部のプログラムから起動することも可能です。

ジョブのモニタリング

モニタ機能により、実行したジョブの実行時間や処理件数などのパフォーマンスをチェックできるほか、結果のグラフ表示やHTML形式でのレポート出力も可能です。

* HTML：HyperText Markup Language

ジョブの実行制御

ページの先頭へ

リリース－リリースバージョン管理

ジョブのパッケージ化

開発したジョブはまとめてパッケージ化して、本番環境にリリース後、実行します。
リリース後にジョブの修正が発生した場合、再度パッケージの再ビルドを行うことで、更新履歴や差分情報を自動で出力・管理することができます。
例えば、本番稼動後にソースデータの形や量が変わりジョブを修正した場合、リリースした一連の処理の修正箇所を視覚的に把握できます。このビルドバージョンの履歴情報を利用することで、例えば、前バージョンのジョブに戻すといった処理も可能です。

ジョブのパッケージ化