研究 / Research
コンテンツ科学研究系
KATAYAMA Norio
コンテンツ科学研究系 准教授
研究紹介
大量の動画から知識を紡ぎ出す
大量に蓄積した映像や音声を効果的に利用できれば、コンピューター・ビジョンやロボットのための知識源として有用です。このため、大規模な映像や音声のマルチメディア・データベースを高速かつ縦横無尽に処理できるようにする、それが私の目標です。
大規模な映像データベースを高速に処理する
最近はハードディスク・レコーダーなどが普及して、放送局だけでなく、家庭でも大量に映像を蓄積できるようになりました。これは大きな技術革新ですが、さらに、その中から特定の映像を探したり映像相互の関連を見つけ出そうとすると、現在の技術はまだまだ未熟です。番組名などを一緒に記録しておいて検索できるレコーダーはありますが、例えば「誰かがあることをしている」とか、「あるシーンに似たシーンを探す」といった検索は、現在の技術ではほとんどできません。私はこういった映像処理技術を可能にするための基盤技術となるデータベース処理技術を研究しています。
データベースの高速化手法の1 つに索引(インデックス)がありますが、映像データベースを高速化するには文字列や数値データとは異なる新しい構造の索引が必要になります。私は、この未開拓な課題に取り組み、索引のデータ構造や探索アルゴリズムを中心に研究をしてきました。
高速・高機能なマルチメディア・データベースを目指す
映像解析の研究は長い歴史をもっていますが、実際に大量の映像を扱えるようになったのはつい最近のことです。国立情報学研究所でも、私も参加して数千時間もの放送映像を丸ごと記録して研究に使っていますが、10 年前ならとても考えられなかったことです。しかし、必要なのは蓄積されたデータベースを意のままに操作することであり、このためには、今の計算機の性能では十分ではありません。
私は、この問題を解決するキーテクノロジーとして、グリッド技術とSMP 技術に注目しています。グリッド技術は、たくさんの計算機を同時に使うことで大量の処理をさせる技術です。一方、SMP 技術は1台の計算機の中でたくさんのプロセッサーを緊密かつ同時に働かせる技術です。これらの技術に適したデータベース・アルゴリズムを考案することで、従来の計算機に比べて100 倍以上高速で、かつ高機能な新しいマルチメディア・データベース・システムを実現していきたいと考えています。