田村, 哲嗣, 宮島, 千代美, 北岡, 教英, 武田, 一哉, 山田, 武志, 滝口, 哲也, 柘植, 覚, 山本, 一公, 西浦, 敬信, 中山, 雅人, 傳田, 遊亀, 藤本, 雅清, 松田, 繁樹, 小川, 哲司, 黒岩, 眞吾, 中村, 哲
情報処理学会研究報告. SLP, 音声言語情報処理 2010(7) 1-6 2010年7月
本稿では,音声と画像を用いたマルチモーダル音声認識の共通評価基盤 CENSREC-1-AV について紹介する.CENSREC-1-AV では,音声・画像データベースおよびベースラインシステムを提供する.音声は学習用クリーンデータのほか,乗用車走行雑音を付与したものを収録した.画像はカラー映像と近赤外線映像を収録し,ガンマ補正を用いて乗用車走行シミュレーション画像をテストデータとした.ベースラインシステムでは,MFCC と,固有顔ないしはオプティカルフローを特徴量として,マルチストリーム HMM により認識を行った.