DataStageは、企業内に散在する膨大で多種多様なデータを、ビジネスに活かせる情報に変換できるデータ統合の開発基盤(ETLツール)です。
既存システムのデータを抽出し、自由にデータを加工した後、ターゲットに格納する処理を視覚的に開発することができます。
DataStageではジョブ開発を効率よく行うためにプロジェクト内でジョブを管理し、チームで分担開発するための多様なプロジェクト管理機能をご用意しています。例えば、次のようなものがあります。
これらの機能により、大規模な共同開発に対応できます。
データベースのディクショナリ、COBOL COPY句、XMLファイルなどのテーブル定義情報を取り込むことができます。
データ抽出・変換・集計などのデータ統合処理のジョブを、ドラッグ&ドロップとパラメータ設定の簡単なGUI操作で開発します。特にデータ加工処理では、データの突き合わせ、重複削除、集計、ソート、コード変換、クレンジングなどの部品や関数を豊富に提供。
データの流れを視覚的に把握しながら、データ加工処理を効率よく開発することができます。
データの条件分岐や重複削除、ファイル間の差分抽出、スタースキーマの更新データ作成など、高度な加工処理のための部品を標準で提供。ユーザーが独自に関数を作成して使用することもでき、複雑なデータ加工にも対応します。
GUI画面で作成したデータ統合処理のジョブ定義をコンパイルし、実行可能な状態にできます。
GUIによる簡単な操作でジョブの起動・停止が可能。また、ジョブは標準コマンドインターフェースから呼び出すことが可能なため、外部のプログラムから起動することも可能です。
モニタ機能により、実行したジョブの実行時間や処理件数などのパフォーマンスをチェックできるほか、結果のグラフ表示やHTML形式でのレポート出力も可能です。
開発したジョブはまとめてパッケージ化して、本番環境にリリース後、実行します。
リリース後にジョブの修正が発生した場合、再度パッケージの再ビルドを行うことで、更新履歴や差分情報を自動で出力・管理することができます。
例えば、本番稼動後にソースデータの形や量が変わりジョブを修正した場合、リリースした一連の処理の修正箇所を視覚的に把握できます。このビルドバージョンの履歴情報を利用することで、例えば、前バージョンのジョブに戻すといった処理も可能です。
大規模のデータを高速に処理するためのパラレル実行を容易に実現します。
統合システム運用管理「JP1」などの運用管理ツールから、DataStageのジョブを制御できます。運用管理ツールによる、きめ細やかなスケジューリング、エラーハンドリング、他処理との連携が可能です。
JP1連携により、高度なジョブ実行制御を実現
作成したジョブからHTML形式のジョブレポートを自動生成。保守用ドキュメントとしてのジョブ設定書作成・修正の工数を大幅に削減できます。また、ユーザー定義のスタイルシートを使用して体裁のカスタマイズも可能です。
テーブル定義やルーチンなどのジョブごとの使用状況を表示し、設定変更時の影響を分析できます。また、結果のグラフィック表示やHTML形式でのレポート出力も可能です。
任意の2つのジョブの差分情報を表示し、差分情報から編集箇所を特定したり、別プロジェクトの同名ジョブとの同一性を確認できます。