WEKO3
アイテム
Analysis of Stream-Dependent Tying Structure for HMM-based Speech Synthesis
https://nitech.repo.nii.ac.jp/records/3397
https://nitech.repo.nii.ac.jp/records/3397fc9e1084-ebe9-4067-80f2-c456038a7a01
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 会議発表論文 / Conference Paper(1) | |||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2012-11-07 | |||||||||||||||||||||||||||||
タイトル | ||||||||||||||||||||||||||||||
タイトル | Analysis of Stream-Dependent Tying Structure for HMM-based Speech Synthesis | |||||||||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||||||||
言語 | ||||||||||||||||||||||||||||||
言語 | eng | |||||||||||||||||||||||||||||
資源タイプ | ||||||||||||||||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||||||||||||||||||||
資源タイプ | conference paper | |||||||||||||||||||||||||||||
著者 |
Yu, Zhi-Peng
× Yu, Zhi-Peng
× Wu, Yi-Jian
× Zen, Heiga
× 南角, 吉彦
× 徳田, 恵一
|
|||||||||||||||||||||||||||||
書誌情報 |
en : ICSP 2008. 9th International Conference on Signal Processing, 2008. p. 655-658, 発行日 2008 |
|||||||||||||||||||||||||||||
出版者 | ||||||||||||||||||||||||||||||
出版者 | Institute of Electrical and Electronics Engineers | |||||||||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||||||||
著者版フラグ | ||||||||||||||||||||||||||||||
出版タイプ | VoR | |||||||||||||||||||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||||||||||||||
DOI | ||||||||||||||||||||||||||||||
関連タイプ | isIdenticalTo | |||||||||||||||||||||||||||||
識別子タイプ | DOI | |||||||||||||||||||||||||||||
関連識別子 | http://dx.doi.org/10.1109/ICOSP.2008.4697216 | |||||||||||||||||||||||||||||
関連名称 | 10.1109/ICOSP.2008.4697216 | |||||||||||||||||||||||||||||
内容記述 | ||||||||||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||||||||||
内容記述 | In conventional HMM-based speech synthesis framework,spectral features are modeled in one stream, andstream-dependent tree-based clustering was then appliedfor tying the model parameters. In this paper, we investigateseveral different stream-dependent tying structuresfor spectral features by splitting the feature vectorinto several streams. One splitting approach is to spliteach feature dimension into each stream. Another oneis to split the static and dynamic features into differentstreams. Although splitting spectral features into differentstreams would ignore the correlation of context dependencybetween them, the number of model parameterscan be optimized for each stream after stream-dependentclustering. From the experimental results, both splittingapproaches can improve the quality of synthesizedspeech. However, the quality of synthesized speech becameworse when we combined these two splitting approaches. | |||||||||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||||||||
内容記述 | ||||||||||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||||||||||
内容記述 | September 15-18, 2008Tokyo, Japan | |||||||||||||||||||||||||||||
言語 | en |