ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究論文

Lip Location Normalized Training for Visual Speech Recognition

https://nitech.repo.nii.ac.jp/records/4893
https://nitech.repo.nii.ac.jp/records/4893
6c517678-c640-4dc5-ac0f-aca942cdd705
名前 / ファイル ライセンス アクション
E83-D_1969.pdf 本文_fulltext (2.5 MB)
Copyright (c) 2000 IEICE http://search.ieice.org/index.html
Item type 学術雑誌論文 / Journal Article(1)
公開日 2012-11-07
タイトル
タイトル Lip Location Normalized Training for Visual Speech Recognition
言語 en
言語
言語 eng
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者 Vanegas, Oscar

× Vanegas, Oscar

en Vanegas, Oscar

Search repository
徳田, 恵一

× 徳田, 恵一

en Tokuda, Keiichi

ja 徳田, 恵一
ISNI

ja-Kana トクダ, ケイイチ


Search repository
Kitamura, Tadashi

× Kitamura, Tadashi

en Kitamura, Tadashi

Search repository
著者別名
姓名 Tokuda, Keiichi
言語 en
姓名 徳田, 恵一
言語 ja
姓名 トクダ, ケイイチ
言語 ja-Kana
著者別名
姓名 北村, 正
書誌情報 en : IEICE transactions on information and systems

巻 E83-D, 号 11, p. 1969-1977, 発行日 2000-11-20
出版者
出版者 Institute of Electronics, Information and Communication Engineers
言語 en
ISSN
収録物識別子タイプ ISSN
収録物識別子 0916-8532
item_10001_source_id_32
収録物識別子タイプ NCID
収録物識別子 AA10826272
出版タイプ
出版タイプ VoR
出版タイプResource http://purl.org/coar/version/c_970fb48d4fbd8a85
内容記述
内容記述タイプ Other
内容記述 This paper describes a method to normalize the lip position for improving the performance of a visual-information-based speech recognition system. Basically, there are two types of information useful in speech recognition processes; the first one is the speech signal itself and the second one is the visual information from the lips in motion. This paper tries to solve some problems caused by using images from the lips in motion such as the effect produced by the variation of the lip location. The proposed lip location normalization method is based on a search algorithm of the lip position in which the location normalization is integrated into the model training. Experiments of speaker-independent isolated word recognition were carried out on the Tulips1 and M2VTS databases. Experiments showed a recognition rate of 74.5% and an error reduction rate of 35.7% for the ten digits word recognition M2VTS database.
言語 en
戻る
0
views
See details
Views

Versions

Ver.1 2023-05-15 13:44:38.806426
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3