マスクド・アナライズ
ITコンサルタント
Twitterで現場目線による辛辣かつ鋭い語り口で情報発信を行い、業界内で注目を集める謎のマスクマン。企業や大学におけるDX・AI・データサイエンス導入活用の支援、人材育成、イベント登壇、書籍や論文の執筆などを手掛けている。執筆・寄稿歴は「ITmedia」「ASCII.jp」「Business Insider Japan」「IT人材ラボ」(現「HRzine」)など多数。著書に『未来IT図解これからのデータサイエンスビジネス』(MdN刊・共著)、『AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]』(技術評論社刊・共著)がある。
モデレーター・額賀信尾
(株)日立製作所 Lumada Data Science Lab.
副ラボ長
中央研究所にて、AIやロボットの研究開発と事業化に従事。2015年からスマートシティやモビリティサービス分野のドメインエキスパートとして、AIを活用したソリューションの顧客協創をリード。2021年より現職となり、トップデータサイエンティストを集結したLumada Data Science Lab.の副ラボ長としてLumada事業拡大の加速と研究開発の強化を図っていく。
吉田 順
(株)日立製作所 Lumada Data Science Lab.
副ラボ長
2012年にAI/ビッグデータ利活用を支援する「データ・アナリティクス・マイスター・サービス」を立上げ、多数のAI/ビッグデータ利活用プロジェクトを推進。2021年より現職となり、トップデータサイエンティストを集結したLumada Data Science Lab.の副ラボ長として、Lumada事業拡大の加速と人財育成の強化を図っていく。
徳永 和朗
(株)日立製作所 Lumada Data Science Lab.
担当部長
半導体技術者としてキャリアをスタートし、LSIの設計開発など日立の次世代モノづくりに携わる。2013年よりAI・ビッグデータを活用したデータサイエンス領域を担当。さまざまな分野のデータサイエンスプロジェクトを多数経験。また、自身のモノづくり現場の経験を活かし、現場へのデータ サイエンス、AI 適用が進められるデータサイ エンティストの育成にも関わる。
諸橋 政幸
(株)日立製作所 Lumada Data Science Lab.
データサイエンスエキスパート
2012年にデータ分析部署に配属してからデータ分析に関わるようになり、現在はデータサイエンティストとして、顧客の課題をデータ分析・AIを使って解決する業務を担当している。さらに社内の分析ナレッジの蓄積や活用推進も担当。また、分析を趣味としており、プライベートでデータ分析コンペなどに参加している。SIGNATE主催の創薬コンペ1位、Nishika主催のレコメンドコンペ2位。2021年6月に開催された「MLB Player Digital Engagement Forecasting」でKaggle Masterの称号を取得。
データサイエンスプロジェクトを成功に導くには
〜 マスクド・アナライズ氏とのパネルディスカッション 〜
「実践 データ分析の教科書」の発刊を記念したイベント「データサイエンスプロジェクトを成功に導くには」が11月5日、「Lumada Innovation Hub Tokyo」からオンライン配信で開催されました。
イベントには、書籍を監修したLumada Data Science Lab.(以下、LDSL)のメンバーと「データ分析の大学」を11月29日に発刊したマスクド・アナライズ氏が登壇し、Part1「今どきの分析プロジェクトのトレンド、成功・失敗のポイントとは?」、Part2「データサイエンティストという人財に関して」に分けてパネルディスカッションを行いました。
今回は書籍に関連する部分を中心にPart1とPart2に分けてイベントの内容をご紹介します。
額賀:日立が9月に出版した「実践 データ分析の教科書」が生まれたきっかけについて教えてください。
吉田:日立はデータサイエンティストの育成に取り組み、目標として掲げていた3000名を2021年3月末に達成しました。3000人の規模になってくると、教科書的なものが必要になってきます。それが今回の書籍誕生のきっかけです。同時に、日立がAIやデータサイエンスに取り組んでいることを世の中に広く知っていただきたいという思いもありました。
実は、この書籍は2年前ぐらいにも出そうとしていました。ただ、当時は「売れないから」と言われてしまって(笑)。2年前はPythonが盛り上がってきていたので「Pythonの教科書みたいな本だったら売れそうですが、データサイエンスの教科書はちょっと…」というのが出版社の反応でした。
それから2年が経って、今回出版してくださったリックテレコムさんから「来ました!」と。ついに、データ分析に興味を持ってもらえる時代が来たということで、出版にたどり着いたという経緯です。LDSLのみんなに声をかけ、分担して執筆に取りかかりました。
額賀:内容についても紹介をお願いします。
吉田:書籍は6章で構成しています。1章から3章までは基礎編で、4章から専門的になっています。1章は「データサイエンスの現場」。データサイエンティストというのはどのような人たちなのかを書いています。データサイエンティストは、それぞれみんな個性があって十人十色です。データサイエンティストといってもずっと分析している人ばかりではなくて、色々なタイプがあるということを紹介しています。そして、2章は「データサイエンティストになるには」です。学生向けにデータサイエンティストになるために必要なことをお示ししました。
3章の「データサイエンスプロジェクトの進め方」では、業務課題の把握や分析方法の設計、データ分析・加工など、基礎的な内容や“あるある集”、気をつけるべきポイントをまとめています。日立社内にはノウハウを共有するサイトがあり、そこに2年前に“POCあるある集”を載せました。それをベースにしてあらためて再編しているので、現場の実情を感じられるかと思います。
4章は「分野別に学ぶデータサイエンス」です。数値解析や画像認識、テキスト解析などについて解説しています。サンプルもつけているので、手を動かして試せるような内容にしています。5章は「データサイエンスの現場適用とは」。AIをシステムに適用して、運用するフェーズの話です。分析モデルやMLOpsの話などが書いてあります。MLOpsについて教科書的に解説している書籍はまだ少ないと思います。そして6章では「データサイエンティストの未来」について書かせていただきました。
データサイエンスについて一通りのことを書いたので、流れで理解しやすいと思います。もちろん、興味のある分野をアラカルトで読んでいただくのもお勧めです。初級者向け、学生向けとしていますが、プロジェクトを経験された方が読んでも参考になる内容です。手元において時々読んでいただけるような、長くお使いいただける書籍になっています。
マスク:一通り拝読しました。タイトル通り、本当に教科書になっています。出版関係の事情で、おおげさに「教科書」とつけることがありますが(笑)、こちらはまさしくタイトル通りに教科書として必要な内容がきちんと網羅されています。データ分析における研究開発や技術的な解説など、書かれているのでとても参考になりますし、幅広い方々に読んでいただけると思います。
額賀:Part1では「今どきの分析プロジェクトのトレンド、成功・失敗のポイントとは?」というテーマでディスカッションを進めていきたいと思います。最近の分析プロジェクトやAIビジネスのトレンドについてどのように見ていますか?
吉田:AIという言葉をメッセージとして使い始めたのが2013年ぐらいです。当時はAIの技術を知りたい、まずは試してみたいという声が多かったですね。ディープラーニングとは何か。日立独自のAIにはどんなものがあるか。そういうお話が多かったです。お客さまの側にデータサイエンティストがいないので、お任せしたいと。課題解決というよりは、とりあえずAIをやってみたいということですね。
潮目が変わってきたのは2019年です。2020年、2021年はDXというキーワードが盛んに出てきました。その中で、特定の課題を解決できるようなソリューションを提案してほしいというお話や、ソリューションがなければ協創型で一緒に考えたいというお客さまが増えてきました。また、最近ではデータサイエンティストの中途採用や育成を支援してほしいというニーズがかなり増えてきています。
マスク:吉田さんからお話があったように、大企業を中心にDX、データサイエンスが浸透してきていると感じています。データサイエンティストの育成の必要性については、私も痛感しているところです。
額賀:データサイエンスを活用する業種や分野の変化、広がりをどう見ていますか?
マスク:今まではいわゆるITに関わりの深い部分、例えばECサイトやスマホアプリなどのデータ分析にAIを使っていました。しかし、今は生活に身近な、あまりITと関係ないと思われていた分野で使われていますね。例えば、UberEATSやコールセンターなどの仕事でAIが使われています。
額賀:だんだん生活に近い分野にAIやデータサイエンスが使われてきているということですね。そのきっかけとして、実際に使える技術が増えてきたことが関係ありそうです。
徳永:マスクさんのお話を伺って、私たちの方向性が間違っていなかったと安心しました。日立には産業系のイメージを持っている方もいらっしゃるかもしれませんが、設備の予兆検知だけではなく、業務の効率化やマーケティングなどにAIを使いたいというニーズにも対応しています。
額賀:データ分析の成功・失敗についても話を進めていきたいと思います。3章にはデータサイエンスプロジェクトの失敗しないための進め方が書かれていますね。
吉田:個人的に大事だと思っているのは、プロジェクト開始のところです。業務課題の把握をして、ゴールを設定して、テーマを決める。ここにほぼ尽きると思います。なぜゴール設定が重要なのかというと、そこで全てが決まるからです。ゴールが小さいと、何をどう頑張っても大きな成果にはつながりません。
一方で、分析手法が簡単であっても、経営的に価値がある内容ならば成果が出せます。技術的な難易度よりも重要なのはゴールの大きさ、経営的な価値がどれぐらいあるかです。ゴールを設定すれば、あとはどうやって問題を解いていくか。仮設を立て、分析手法を決め、お客さまとプロジェクトを推進していきます。やはり、最初の入り方が全てだと思っています。
額賀:現場サイドから見たプロジェクトの成功と失敗について教えてください。
徳永:現場は100%の精度を望みますが、完璧なAI、ディープラーニングというのはないので、いかに折り合いをつけるのかがポイントです。折り合いがつかずに、AIの精度は優れていたにも関わらず、現場適用できずにPOCで終わってしまったプロジェクトもあります。実際の業務活用を視野に入れてプロジェクトを進めていく事が成功のポイントだと思います。
額賀:データ分析のプロジェクトの進め方のご助言をお願いします。
マスク:お二方からプロジェクトマネジメントや現場のお話がありました。やはり、課題設定が大切ですね。「知識や経験値がどれぐらい必要で、実際に課題解決ができるのか」という、実行可能性をプロジェクト開始時に見極めることが重要です。
額賀:Part2ではデータサイエンティストの人財について議論を進めていきます。ここからは諸橋さんにも加わってもらいます。最初に吉田さんから書籍の1章「ビジネスの現場で活躍するデータサイエンティストとは?」の内容を紹介いただけますでしょうか。
吉田:LDSLには100名以上のデータサイエンティストがいますが、本当に十人十色です。書籍を執筆する際に、「ビジネス力」「データサイエンス力」「データエンジニア力」という3パターンで人財について分析しようと考えていたのですが、諸橋さんから3パターンではないと。十人十色なんだから10パターンだと指摘されて、さらに細かく分類しました。
「プロジェクトマネージャータイプ」というのは、分析プロジェクトの取りまとめが得意な人です。私もここが得意だと思っています。「デジタルビジネスコンサルタイプ」と「ドメイン特化型コンサルタイプ」はコンサルタイプで、どちらかという上流工程でお客さまの経営課題・業務課題を踏まえてドメイン知識から課題解決に導くような、通常のコンサルと言ってもいいようなメンバーが中心です。デジタルビジネスコンサルというのは幅広い業種に対応できるメンバーです。ドメイン特化型は電力向けとか、特化したコンサルタイプ。これらがビジネスに強いタイプです。
データサイエンティストのタイプ
データサイエンティストチームで活躍しているメンバーは十人十色であり、8つのスキル用いて、典型的な10タイプに分類してみました。
次がデータサイエンスに強いタイプです。「ソリューション特化型分析アーキテクトタイプ」というのは、フロントでなにがしかのソリューションを担当されている方で、効率的な分析をしています。「ドメイン特化型分析アーキテクトタイプ」というのは、徳永さんをイメージしています。製造業に特化していて、上流工程の分析やテクニカルなところが得意な人というイメージです。悩んで名前をつけたのは「非定型データ分析アーキテクトタイプ」。これは諸橋さんをイメージしていて、分析ならなんでもござれというタイプ。「分析作業者タイプ」はアーキテクトタイプの指示に従って作業をする方です。先輩の下について指導を受けるような人ですね。
最後はデータエンジニア力が強いタイプです。まずは「分析プロト開発者タイプ」。分析の結果は目に見える形でないとなかなか伝わりにくいので、ササッとプロトタイプをすぐに作ってくれるメンバーがいると重宝します。どちらかというとデータサイエンスの結果をシステム化する人たちです。「分析システムアーキテクトタイプ」はシステムアーキテクチャを決められる人で、「分析システム開発者タイプ」はそのアーキテクチャに従ってシステムを開発できる人です。
額賀:人財の範囲を幅広く取っているということでしょうか。
吉田:「それはプロマネだろ。コンサルだろ。SEじゃないの?」と思われるかもしれませんが、データサイエンスというテーマの中で、広義の意味での人財をタイプ別に説明しています。
各タイプの得意分野を「分析設計力」や「分析モデリング力」、「プロマネ力」など8つの項目のレーダーチャートで示しています。このようなかたちで特徴を捉えておくと、これからデータサイエンティストを目指される方や学生の方も、こういったところを伸ばせばいいんだなというところが見えてくると思います。データサイエンティストの1日の過ごし方も書籍には載せていますので、参考にしてみてください。
額賀:マスクさんは1章をご覧になって、どのようにお感じになりましたか?
マスク:職務が細かく分類されているのが新鮮でした。今まではデータサイエンティスト協会が示しているパターンしかなかったので、本書のように細分化されることによって、プログラミングが苦手な方でもビジネス分野で役に立てることが分かります。求められるスキルが可視化されるので、目標を立てやすくなり、何を学んでどんなことができるのか、という方向性が見えてモチベーションが高まると思います。個人的にこのパートは、とても気に入っていますね。
額賀:データサイエンティストとして熟達するコツについても話を深めていきたいと思います。
マスク:技術力はもちろん大事なポイントですが、プラスアルファでプロジェクトマネジメントができるなど、個別分野の能力を伸ばしていくといいですね。特にチームを取りまとめて、お客さまに対して結果を残せるリーダー層となる人財が足りないと感じています。そこは多くのノウハウや案件を持つ日立さんに強みがあるのではと思います。
吉田:十人十色と何度も言っていますが、個性的なメンバーが多いのでまとめるのが大変ですね(笑)。成果を出してもらいながら、楽しく、元気なチームを作るのは非常に難しいなと思っています。他社の方々と話しても、苦労している人が多いなという印象です。リーダーには人間力などいろんな要素が必要だなと日々感じています。
徳永:チームワーク、チーム構成が大事だと思っています。統計、分析が好きだという人だけを集めるのではなく、お客さまの課題を整理できる人も必要です。お客さまの業務課題、データを解釈し、それをアルゴリズムに落として、システム化や業務適用していきます。1つのプロジェクトを回すために大体5人ぐらいの各分野の技術を持った人を組み合わせて、プロジェクトを進めていきます。課題解決のためにはチーミングが大切ですね。ビジネスの観点まで考えたマネジメントも必要です。
額賀:データサイエンティストとして熟達していくために工夫したことはありますか?
諸橋:私は2013年ぐらいからデータ分析をやり始めたのですが、大学で統計学を学んでなく、何も知らない状態でした。まずは知識を付けようと思って、統計学やデータマイニング、機械学習、ディープラーニングなどの書籍を週末に読みました。しかし,あまりに範囲が広く,学ぶべきことが多いので,勉強すればするほどきりがないなと思い、軽く絶望しました。
事前に準備をして万全な状態で業務をすることは難しいので,発想を変えて、業務で必要な技術や知識が見つかったら、その都度勉強する方が効率的だと思い、そのような考え方にシフトしました。
また,業務で使うスキルは業務で磨くのが一番いいので,多くの案件に携わるように心掛けました。こういう発想になると、新しい案件が来た時に、「私はそのスキルを持ってないからやらない」ということではなく、勉強のチャンスだと捉えて、新しいことにチャレンジするようになります。今もこのような心構えで業務をしています。
額賀:スキルアップのコツを1つ教えていただけないでしょうか。
マスク:これはもう「元気ですか!」がキーワードです。諸橋さんがおっしゃったように、どこまで勉強しても終わりはないので、やる気や興味関心がないと続きません。会社から学べと言われても、「面倒だなぁ」と思ってしまうのが人間なので、好奇心を持ち続けるのが重要だと思います。そのためにも私の書籍「データ分析の大学」と「実践 データ分析の教科書」で学んでみてはいかがでしょうか(笑)。
様々な分野に話が及び、あっという間の2時間。書籍ではデジタルトランスフォーメーション(DX)に取り組む企業のIT担当者、将来の職業としてデータサイエンティストを希望する学生に向けて、現場で即戦力になるためのデータサイエンスのポイントを解説しています。データ分析の基礎技術や手順だけでなく、データサイエンスプロジェクトで失敗しないためのノウハウについて、ご紹介していますので、ぜひ教科書としてお手元において活用してみてはいかがでしょうか。