本文へジャンプ

Hitachi

このニュースリリース記載の情報(製品価格、製品仕様、サービスの内容、発売日、お問い合わせ先、URL等)は、発表日現在の情報です。予告なしに変更され、検索日と情報が異なる可能性もありますので、あらかじめご了承ください。なお、最新のお問い合わせ先は、お問い合わせ一覧をご覧下さい。

2008年3月17日

映像につけられた様々なテロップの文字を自動認識する技術を開発

映像データの中から見たいシーンをすばやく探すテロップ検索の基本技術を開発

  株式会社日立製作所(執行役社長:古川 一夫/以下、日立)は、膨大な映像データが流通すると予想される放送通信融合時代の映像シーン検索技術の実現に向けて、登場人物や地名などを紹介するために映像につけられているテロップの文字を、高い精度で読み取る技術を開発しました。本技術では、複数行のテロップや、黒文字と白文字が同一行で使用されているような複雑なテロップにも適用可能であるなど、テロップの形やデザインにかかわらず文字抽出ができます。また、抽出後に文字認識を行うことによって、テロップから文字データへの自動変換が可能です。本技術は、膨大な映像コンテンツの中から、見たいシーン*1をキーワードを基にすばやく見つけ出すという、次世代映像検索の基本技術となります。

*1
シーン:映像中の意味のまとまった一つの区間のこと。

  近年、高速通信ネットワークや大容量サーバなどの出現により、ネットワークを通じた映像コンテンツの流通が容易になり、映像を様々な形態で公開し、共有することが可能となってきました。また、撮影映像のデジタル化、家庭用PCによる編集技術の普及などにより、誰でも簡単に、テレビ映像に近い高品質な映像コンテンツを制作して、発信することができるようになりつつあります。このような背景から、今後、本格的な放送通信融合時代には、膨大な映像コンテンツの中から必要な情報(シーン)をすばやく探し出すことのできる検索機能へのニーズが高まってくると考えられます。
  従来、こうしたシーン検索を簡単に行うには、あらかじめシーンごとにキーワードを映像に付与し、これを検索に利用する方法が一般的でした。しかしながら、キーワードを映像に付与することは、手間がかかります。そこで、映像に合成された文字情報であるテロップを、検索の際のキーワードとして利用する技術の開発が進められています。
  テロップを検索キーワードとして用いるためには、テロップから文字を抽出し、それを認識する必要があります。しかし、テロップには、複数行から構成されているものや、白文字と黒文字が同一行で使われているように、明暗の反転した文字が混在するものなど、多様な形状やデザインがあり、従来の文字抽出技術では、すべてのテロップに対応することが困難で、テロップ検索を実用的に用いるための読出し精度が得られていませんでした。

  今回、日立は、複数行にわたるテロップや明暗が反転した文字が混在する複雑なテロップに対しても、文字抽出を行うことができる新方式の文字抽出技術を開発しました。

  開発した新方式の文字抽出技術は以下の通りです。

(1)複数行で構成されるテロップに対応した、文字列抽出のための新アルゴリズム

映像中のテロップから文字領域を抽出する手順は、[1]映像からテロップ出現時刻とテロップ領域を検出する、[2]テロップの領域から文字列部分を抽出する、[3]文字列部分から各文字画像を抽出する、という3段階に分けられます。今回、[2]の文字列部分を抽出する技術として、文字ではない図形を検出して除去するための新アルゴリズムを開発しました。これによって、複数行にわたるテロップの中の文字部分を行ごとに抽出することが可能となりました。

(2)明暗反転文字が混在したテロップに対応した文字画像抽出のための新アルゴリズム

  文字領域の抽出手順である[3]の文字画像を抽出する技術として、そこが文字であるのか背景であるのかを判別する新アルゴリズムを開発しました。本アルゴリズムにより、「明るい背景に暗い文字」と「暗い背景に明るい文字」が一つのテロップ内に混ざっていても、文字を正しく抽出することが可能となりました。

  今回開発した文字領域の抽出技術と文字認識技術を組み合わせて、テロップの文字認識の評価実験を行ったところ、90%以上の精度で、映像中のテロップから、文字を認識できることを確認しました。
  本技術を用いてテロップを文字データに自動的に変換し、これをキーワードとして登録しておくことで、映像コンテンツのシーン検索を行うなど、テロップを用いた映像検索の実現に向けた見通しが得られました。
  将来、テロップを用いた映像検索が可能になると、映像にキーワードを付与することなく、多数の映像コンテンツから必要な映像シーンを見つけ出すことや、映像コンテンツに含まれるキーワードを抜き出して提示することで、映像コンテンツの概要を把握することなどが可能になります。
  このように、本技術は放送通信融合時代の映像検索機能を実現するキー技術といえます。

  なお、今回開発した技術については、2008年3月18日から3月21日まで、北九州市で開催される「電子情報通信学会2008年総合大会」で発表する予定です。

お問い合わせ先

株式会社日立製作所 中央研究所 企画室 [担当:木下]
〒185-8601 東京都国分寺市東恋ヶ窪一丁目280番地
TEL : 042-327-7777 (直通)

以上

Adobe Readerのダウンロード
PDF形式のファイルをご覧になるには、Adobe Systems Incorporated (アドビシステムズ社)のAdobe® Reader®が必要です。