WEKO3
アイテム
Factor Analyzed Voice Models for HMM-Based Speech Synthesis
https://nitech.repo.nii.ac.jp/records/3410
https://nitech.repo.nii.ac.jp/records/3410daab0a7f-c419-4017-9de4-55b2560cac14
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
c2010 IEEE. Personal use of this material is permitted. However, permission to reprint/republish this material for advertising or promotional purposes or for creating new collective works for resale or redistribution to servers or lists, or to reuse any copyrighted component of this work in other works must be obtained from the IEEE.
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2012-11-07 | |||||||||||||||||||||
タイトル | ||||||||||||||||||||||
タイトル | Factor Analyzed Voice Models for HMM-Based Speech Synthesis | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
言語 | ||||||||||||||||||||||
言語 | eng | |||||||||||||||||||||
資源タイプ | ||||||||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||||||||
資源タイプ | conference paper | |||||||||||||||||||||
著者 |
Kazumi, Kyousuke
× Kazumi, Kyousuke
× 南角, 吉彦
× Wu, Yi-Jian
|
|||||||||||||||||||||
著者別名 | ||||||||||||||||||||||
識別子Scheme | WEKO | |||||||||||||||||||||
識別子 | 8555 | |||||||||||||||||||||
識別子Scheme | NRID | |||||||||||||||||||||
識別子URI | http://rns.nii.ac.jp/nr/1000080397497 | |||||||||||||||||||||
識別子 | 1000080397497 | |||||||||||||||||||||
姓名 | Nankaku, Yoshihiko | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
姓名 | 南角, 吉彦 | |||||||||||||||||||||
言語 | ja | |||||||||||||||||||||
姓名 | ナンカク, ヨシヒコ | |||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||
姓 | Nankaku | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
姓 | 南角 | |||||||||||||||||||||
言語 | ja | |||||||||||||||||||||
姓 | ナンカク | |||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||
名 | Yoshihiko | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
名 | 吉彦 | |||||||||||||||||||||
言語 | ja | |||||||||||||||||||||
名 | ヨシヒコ | |||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||
著者別名 | ||||||||||||||||||||||
識別子Scheme | WEKO | |||||||||||||||||||||
識別子 | 464 | |||||||||||||||||||||
識別子Scheme | NRID | |||||||||||||||||||||
識別子URI | http://rns.nii.ac.jp/nr/1000020217483 | |||||||||||||||||||||
識別子 | 1000020217483 | |||||||||||||||||||||
姓名 | Tokuda, Keiichi | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
姓名 | 徳田, 恵一 | |||||||||||||||||||||
言語 | ja | |||||||||||||||||||||
姓名 | トクダ, ケイイチ | |||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||
姓 | Tokuda | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
姓 | 徳田 | |||||||||||||||||||||
言語 | ja | |||||||||||||||||||||
姓 | トクダ | |||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||
名 | Keiichi | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
名 | 恵一 | |||||||||||||||||||||
言語 | ja | |||||||||||||||||||||
名 | ケイイチ | |||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||
書誌情報 |
en : ICASSP 2010. IEEE International Conference on Acoustics, Speech and Signal Processing, 2010. p. 4234-4237, 発行日 2010 |
|||||||||||||||||||||
出版者 | ||||||||||||||||||||||
出版者 | Institute of Electrical and Electronics Engineers | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
著者版フラグ | ||||||||||||||||||||||
出版タイプ | VoR | |||||||||||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||||||
DOI | ||||||||||||||||||||||
関連タイプ | isIdenticalTo | |||||||||||||||||||||
識別子タイプ | DOI | |||||||||||||||||||||
関連識別子 | http://dx.doi.org/10.1109/ICASSP.2010.5495689 | |||||||||||||||||||||
関連名称 | 10.1109/ICASSP.2010.5495689 | |||||||||||||||||||||
内容記述 | ||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||
内容記述 | This paper describes factor analyzed voice models for realizing various voice characteristics in the HMM-based speech synthesis. The eigenvoice method can synthesize speech with arbitrary voice characteristics by interpolating representative HMM sets. However, the objective of PCA is to accurately reconstruct each speaker-dependent HMM set, and this is not equivalent to estimating models which represent training data accurately. To overcome this problem, we propose a general speech model which generates speech utterances with various voice characteristics directly. In the proposed method, the HMM states, factors representing voice characteristics and contextual decision trees are simultaneously optimized within a unified framework. | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
内容記述 | ||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||
内容記述 | 14-19 March 2010 Dallas, TX, USA | |||||||||||||||||||||
言語 | en |