データ分析がうまくいかないと感じている方がいらっしゃるかもしれません。しかし本当にうまくいっていないのでしょうか。データ分析は1回で成果が出ないのが当たり前で、データ分析を何回も繰り返すことが重要です。そのために必要なポイントは「効率化」です。ここでは、データ分析の成功の秘訣とは何かについて見ていきます。
データ分析では以下のようなことがよくあります。
「最終目的は明確だったが、そこまでの道筋が分からず、試行錯誤に時間がかかってしまい途中で期限が来てしまった。」
これは「データ分析を試行錯誤した」という事例ですが、データ分析は1回で成果が出ず、何度か試してみるのがセオリーですから、試行錯誤したこと自体は失敗ではありません。ただ1回分の試行に時間をかけすぎてしまうと、思ったように進みません。繰り返し試行するためにも、1回分の時間のかけ方を考えておく必要があります。
「データを集めたものの、集めたデータは分析用に作られたデータではないため、データ統合だけでコストオーバーしてしまった。」
データ分析というと散布図や相関マトリックスなどを思い浮かべるかもしれませんが、一般的にデータ分析は”見栄え”の仕上げよりも、どんなデータが入っているのかを理解したり、それらデータを掛け合わせて可視化できるよう形式を加工・変換することに多くの手間と時間をかけるものです。データを分析・可視化できるようにデータを統合したり加工することを「データ準備」といいます。ある資料ではこの作業に全体の80%かかると言われています*。データ準備をどれだけ効率化できるかは大変重要です。
「苦労してデータを統合し、分析して結果を現場の人に見せたが、実はもっと別のデータも必要なことが分かった。しかしコスト・工数の問題で別データを取り込めずデータ分析は中止してしまった。」
せっかく苦労してデータ分析をやり遂げたにも関わらず、別の課題が発生してデータ分析をやり直すということもよくあります。つまり、データ分析は繰り返し行うものです。だからこそデータ分析の大部分を占めるデータ準備にかかる時間は短くして効率よく行うことが重要なのです。
データ分析者がデータ準備を行うことが理想ですが、データ準備にはプログラミングスキルや高度なデータベーススキルが要求されることが多いです。そういう場合はデータ準備を情シス部門など他の人に依頼することになりますが、そうするとデータ準備だけで1か月〜2か月かかることもあります。そうなるとデータ分析を繰り返すことが難しくなります。
ポイントをまとめます。
上記3つのポイントに示すように、データ分析1回当たりの所要時間を短縮して、成果が出るまで繰り返しリトライできる環境を整えることが、データ分析プロジェクトの成功の秘訣です。
データ分析者自身がデータ準備を行うことはハードルが高いという場合は、データ準備をサポートするETLツールを採用するのが最善策の1つです。ETLツールを採用することで、プログラミングを知らない人でもデータ準備ができ、データ分析者の裾野を広げることも可能です。
Pentahoには以下を特徴とするETL機能があり、データ分析者自身による、データ準備を含めたデータ分析の効率化を、強力にサポートします。
PentahoのETL機能であればETL処理をGUIで定義できます。データ準備のためのさまざまな部品が提供されており、これらをドラッグ&ドロップで配置し、処理の流れに合わせて矢印でつなぐことで、ETL処理を視覚的に定義できます。
データの加工結果を確認する場合、他のETLツールでは加工結果をファイルなどに出力しなければならないことがありますが、Pentahoでは1.のGUI画面でデータの加工結果を確認でき、データ加工をその場ですぐに修正できます。
1.のGUI画面でデータの可視化も可能で、データの全体像を把握しやすいです。つまり必要なデータ準備が判断しやすいということです。たとえば、項目としてどのような値が入っているのかが分からないこともよくありますが、この機能を使えば値の分布を把握できデータを効率よく理解できます。
他のETLツールではデータ加工定義はPCで作成できても実行にはサーバーが必要ということもあります。PentahoはサーバーがなくてもPC上でデータ加工を実行可能です。
ファイルを数千ファイル集めてみたもののファイルのフォーマットが異なっており、データを加工して統合するだけでも1〜2か月かかりそうでデータ分析に着手できませんでした。また、データ分析用にデータを収集するだけのシステムを作ろうとしましたが、数千万の見積もりになり断念しました。別の案件でPentahoを使用したところ、1〜2か月かかりそうなデータ準備を2日、データの可視化を半日で対応できました。
あるバックオフィス業務を請け負う会社では毎月40社以上向けに帳票作成を作成しています。入力システムや入力ファイルも複数ありますが顧客ごとにそれぞれ帳票作成する必要があり、Pentahoを導入する前は手作業で行っていて非常に手間がかかっていました。Pentahoを導入することで、データの取り込みだけではなく40社以上向けの帳票作成も効率化でき、150時間かかっていた作業が30時間に(1/5に短縮)することができました。
ステップ
データは集めたがデータ統合・加工などでつまずくなど、データ準備でお困りであれば是非お声がけください。Pentahoでの解決方法を一緒に検討いたします。
ステップ
サンプルデータをいただければデータ加工や可視化の一例をお見せします。
また、評価版もご用意しています。評価版だけでは使い方が分からないと心配な方にはファーストステップガイドもご提供します。
さらに、Pentahoのハンズオントレーニングメニュー(有償)もご用意しています。
ステップ
サンプルデータや評価版で導入可能なことが分かっても、業務への本格展開はいきなりは難しいと思います。まずはPoCを実施するなど小さく始めることをお勧めします。PoCのお手伝い(有償)も可能です。サンプルデータではなく実際のデータを使うことになったときに、データの量や種類が増えて戸惑うかもしれません。そんなときはPentahoを使った解決策を一緒に検討いたします。
ステップ
本格導入に向けてはデータ分析者(つまりPentaho使用者)へのトレーニングが必要になることが多くありますが、Pentahoではハンズオントレーニングメニュー(有償)を用意しています。
データ分析はビジネスの重要な役割を担っています。特に、データ分析を効率化することで、タイムリーかつ効果的な施策を見出すことが可能です。
Pentahoはそのようなデータ分析を強力にサポートするETLツールであり、実行に移しやすいです。データ分析を通じて継続的な改善をめざしましょう。