このニュースリリース記載の情報(製品価格、製品仕様、サービスの内容、発売日、お問い合わせ先、URL等)は、発表日現在の情報です。予告なしに変更され、検索日と情報が異なる可能性もありますので、あらかじめご了承ください。なお、最新のお問い合わせ先は、お問い合わせ一覧をご覧下さい。
2018年10月16日
独自の音源分離技術により、話者ごとに識別・分離したテキスト化を実現し議事録作成などを効率化
株式会社日立製作所(執行役社長兼CEO:東原 敏昭/以下、日立)は、このたび、デジタル対話サービス*1の第二弾として、さまざまな業種における会議や商談などの会話音声をテキスト化する「音声書き起こし支援サービス」を10月16日より販売開始します。
本サービスは、会話音声データを音声認識技術により高精度にテキスト化するとともに、テキスト化されたデータの編集を可能とするクラウドサービスです。音声認識技術の一つである日立独自の音源分離技術を用いることで、一つのマイクで録音した複数人の会話音声を話者ごとに識別・分離してテキスト化することができます。これにより、利用者がマイクを意識しない環境においても精度の高い音声テキスト化が可能となり、現場の小規模な打合せから主要会議まで幅広い場面で議事録など記録作業の効率化を実現します。
近年、さまざまな業種で、労働人口の減少や長時間労働の是正など働き方改革が経営課題となる中、業務負荷の軽減や生産性向上が求められています。その一環として、人が本来するべき高度なコア業務に注力出来るように、議事録など記録作成の事務作業を効率化するため、会話音声をテキスト化する音声認識技術の活用に期待が高まっています。
そのような背景のもと、日立では、音声認識技術の向上をめざし、音声認識に関する研究・学会発表を継続的に行い、2018年9月に、音声認識の技術評価国際イベントであるCHiME-5*2において音声認識率で世界2位の評価を得ました。また、本サービスの商用化に先立ち、働き方改革やワークライフバランスの実現をめざす複数のお客さまと協創し、先行的な実証実験から、音声認識の精度や利便性の向上を図ってきました。
本サービスは、日立独自の音声認識技術として、雑音や反響音を除去して認識対象の音声のみを抽出する雑音除去技術と、複数方向からの音声を別々に認識する音源分離技術を活用しており、雑音や複数話者の音声が含まれている音声データでも高精度にテキスト化することが可能です。また、従来、口元とマイクの距離が大きく離れると音声認識率が低下するため、精度の高い音声認識を行うためには、一人一人にマイク設備を用意して録音する必要がありました。しかし、音源方向を特定する日立の技術を組み込んだマイクであれば、一つのマイクで録音した音声データから複数話者の音声を音源方向から識別し、話者ごとのコメントをテキスト化することが可能です。また、一般のマイクやICレコーダー、スマートフォンで録音した音声ファイルもクラウド上にアップロードすることで容易にテキスト化することができます。さらに、お客さま自身が単語や例文の表記と読みを登録できるカスタム言語モデルにより、予め登録されている一般的な用語に加えて、固有名詞や専門用語などを適宜追加することができ、お客さまの業務に合わせた音声認識精度の向上を図ることができます。これらにより、会議の議事録作成や商談の記録作成などさまざまなシーンで事務作業の効率化を実現します。
日立は、今後、先行的なお客さまとの取り組みを日立のデジタルソリューション「Lumada」のユースケースとし、活用シーンを製造現場での設備保全作業の音声記録や、医療現場での電子カルテの音声入力などに広げながら、幅広く展開することで、新たな価値創出や業務改革を支援していきます。
名称 | 概要 | 価格(税別) | 提供開始時期 |
---|---|---|---|
音声書き起こし 支援サービス |
会話音声データを日立独自の音声認識技術により高精度にテキスト化するとともに、テキスト化されたデータの編集を可能とするクラウドサービス | 個別 見積 |
10月31日 |
対話型ボットを活用して業務改革や新たな価値の創出を支援するサービスです。今回、「音声書き起こし支援サービス」を第二弾とし、販売開始します。
本サービスは、日立が2018年10月18日(木)〜19日(金)に、東京国際フォーラムで開催する 「Hitachi Social Innovation Forum 2018 TOKYO」の「FINANCE」のカテゴリーの展示において、ご覧いただけます。
株式会社日立製作所 サービスプラットフォーム事業本部 IoT・クラウドサービス事業部
以上