WEKO3
アイテム
Speaker Adaptation Based on Nonlinear Spectral Transform for Speech Recognition
https://nitech.repo.nii.ac.jp/records/3408
https://nitech.repo.nii.ac.jp/records/3408070ca48e-8fe3-44a9-8ecc-a070da1b11a9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2012-07-05 | |||||||||||||||||||||||
タイトル | ||||||||||||||||||||||||
タイトル | Speaker Adaptation Based on Nonlinear Spectral Transform for Speech Recognition | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
言語 | ||||||||||||||||||||||||
言語 | eng | |||||||||||||||||||||||
資源タイプ | ||||||||||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||||||||||
資源タイプ | conference paper | |||||||||||||||||||||||
著者 |
Hayashi, Toyohiro
× Hayashi, Toyohiro
× 南角, 吉彦
× Lee, Akinobu
× Wu, Yi-Jian
|
|||||||||||||||||||||||
著者別名 | ||||||||||||||||||||||||
識別子Scheme | WEKO | |||||||||||||||||||||||
識別子 | 8555 | |||||||||||||||||||||||
識別子Scheme | NRID | |||||||||||||||||||||||
識別子URI | http://rns.nii.ac.jp/nr/1000080397497 | |||||||||||||||||||||||
識別子 | 1000080397497 | |||||||||||||||||||||||
姓名 | Nankaku, Yoshihiko | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
姓名 | 南角, 吉彦 | |||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||
姓名 | ナンカク, ヨシヒコ | |||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||
姓 | Nankaku | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
姓 | 南角 | |||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||
姓 | ナンカク | |||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||
名 | Yoshihiko | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
名 | 吉彦 | |||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||
名 | ヨシヒコ | |||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||
著者別名 | ||||||||||||||||||||||||
識別子Scheme | WEKO | |||||||||||||||||||||||
識別子 | 8808 | |||||||||||||||||||||||
姓名 | 李, 晃伸 | |||||||||||||||||||||||
著者別名 | ||||||||||||||||||||||||
識別子Scheme | WEKO | |||||||||||||||||||||||
識別子 | 464 | |||||||||||||||||||||||
識別子Scheme | NRID | |||||||||||||||||||||||
識別子URI | http://rns.nii.ac.jp/nr/1000020217483 | |||||||||||||||||||||||
識別子 | 1000020217483 | |||||||||||||||||||||||
姓名 | Tokuda, Keiichi | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
姓名 | 徳田, 恵一 | |||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||
姓名 | トクダ, ケイイチ | |||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||
姓 | Tokuda | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
姓 | 徳田 | |||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||
姓 | トクダ | |||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||
名 | Keiichi | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
名 | 恵一 | |||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||
名 | ケイイチ | |||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||
書誌情報 |
en : INTERSPEECH 2010 p. 542-545, 発行日 2010 |
|||||||||||||||||||||||
出版者 | ||||||||||||||||||||||||
出版者 | International Speech Communication Association | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
著者版フラグ | ||||||||||||||||||||||||
出版タイプ | VoR | |||||||||||||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||||||||
内容記述 | ||||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||||
内容記述 | This paper proposes a speaker adaptation technique using a nonlinear spectral transform based on GMMs. One of the most popular forms of speaker adaptation is based on linear transforms, e.g., MLLR. Although MLLR uses multiple transforms according to regression classes, only a single linear transform is applied to each state. The proposed method performs nonlinear speaker adaptation based on a new likelihood function combining HMMs for recognition with GMMs for spectral transform. Moreover, the dependency of transforms on context can also be estimated in an integrated ML fashion. The proposed technique outperformed conventional approaches in phoneme-recognition experiments. | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
内容記述 | ||||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||||
内容記述 | 26-30 September 2010, Makuhari, Chiba, Japan | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
関連サイト | ||||||||||||||||||||||||
識別子タイプ | URI | |||||||||||||||||||||||
関連識別子 | http://www.interspeech2010.org/ | |||||||||||||||||||||||
関連名称 | http://www.interspeech2010.org/ |