WEKO3
アイテム
隠れマルコフモデルを用いた視覚音声認識のための正規化学習
https://nitech.repo.nii.ac.jp/records/5119
https://nitech.repo.nii.ac.jp/records/51194128d87d-519b-4c55-bb3f-0bc7fb0a2799
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright(c)2003 IEICE http://search.ieice.org/index.html
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2012-11-07 | |||||||||||||||||||||||||||
タイトル | ||||||||||||||||||||||||||||
タイトル | 隠れマルコフモデルを用いた視覚音声認識のための正規化学習 | |||||||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||||||
言語 | ||||||||||||||||||||||||||||
言語 | jpn | |||||||||||||||||||||||||||
資源タイプ | ||||||||||||||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||||||||||||||||||||
資源タイプ | journal article | |||||||||||||||||||||||||||
その他(別言語等)のタイトル | ||||||||||||||||||||||||||||
その他のタイトル | カクレ マルコフ モデル オモチイタ シカク オンセイ ニンシキ ノタメノ セイキカ ガクシュウ | |||||||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||||||
その他(別言語等)のタイトル | ||||||||||||||||||||||||||||
その他のタイトル | Normalized Training for HMM-Based Visual Speech Recognition | |||||||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||||||
著者 |
南角, 吉彦
× 南角, 吉彦
× 徳田, 恵一
× 北村, 正
× 小林, 隆夫
|
|||||||||||||||||||||||||||
著者別名 | ||||||||||||||||||||||||||||
姓名 | Nankaku, Yoshihiko | |||||||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||||||
姓名 | 南角, 吉彦 | |||||||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||||||
姓名 | ナンカク, ヨシヒコ | |||||||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||||||
著者別名 | ||||||||||||||||||||||||||||
姓名 | Tokuda, Keiichi | |||||||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||||||
姓名 | 徳田, 恵一 | |||||||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||||||
姓名 | トクダ, ケイイチ | |||||||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||||||
著者別名 | ||||||||||||||||||||||||||||
姓名 | Kitamura, Tadashi | |||||||||||||||||||||||||||
bibliographic_information |
ja : 電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 巻 J86-D2, 号 2, p. 163-172, 発行日 2003-02-01 |
|||||||||||||||||||||||||||
出版者 | ||||||||||||||||||||||||||||
出版者 | Institute of Electronics, Information and Communication Engineers | |||||||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||||||
ISSN | ||||||||||||||||||||||||||||
収録物識別子タイプ | ISSN | |||||||||||||||||||||||||||
収録物識別子 | 0915-1923 | |||||||||||||||||||||||||||
item_10001_source_id_32 | ||||||||||||||||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||||||||||||||||
収録物識別子 | AA11340957 | |||||||||||||||||||||||||||
出版タイプ | ||||||||||||||||||||||||||||
出版タイプ | VoR | |||||||||||||||||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||||||||||||
内容記述 | ||||||||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||||||||
内容記述 | 本論文では,視覚音声認識のための連続密度HMM(Hidden Markov Model)のパラメータ推定法について述べる.これまでの視覚音声認識の研究は,大きく画像ベース法とモデルベース法の二つに分類することができる.画像ベース法は,原画像の画素値にサブサンプリングや主成分分析などの何らかの前処理を施したものを特徴ベクトルとして用いる手法である.しかし,唇の位置や大きさ,照明条件などが認識率に直接的な影響を及ぼすため,これらの正規化が重要な要素技術となる.従来の正規化手法は,HMMとは独立に何らかの基準を設け,学習の前に正規化を行うのが一般的であった.本論文では,ML(Maximum Likelihood)基準による正規化を考え,唇の位置,大きさ,傾き,平均輝度,コントラストなどの正規化プロセスがモデルの学習と統合された正規化学習法を提案する.提案法は,EM(Expectation Maximization)アルゴリズムに基づいて定式化されており,正規化学習の繰返しにより学習データに関するゆう度が単調に増加することが保証されている.また,M2VTSデータベースを用いた単語認識実験により提案法の有効性を示す. | |||||||||||||||||||||||||||
言語 | ja |