WEKO3
アイテム
HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入
https://nitech.repo.nii.ac.jp/records/5206
https://nitech.repo.nii.ac.jp/records/5206951f47fa-412e-4cdd-ad71-baf7156c613e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 IEICE http://search.ieice.org/index.html
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2012-11-07 | |||||||||||||||||||||||
タイトル | ||||||||||||||||||||||||
タイトル | HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入 | |||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||
言語 | ||||||||||||||||||||||||
言語 | jpn | |||||||||||||||||||||||
資源タイプ | ||||||||||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||||||||||||||||
資源タイプ | journal article | |||||||||||||||||||||||
その他(別言語等)のタイトル | ||||||||||||||||||||||||
その他のタイトル | HMM ニモトズク テキスト オンセイ ゴウセイ ヘノ コンゴウ レイシンゲン モデル ト ポスト フィルタ ノ ドウニュウ | |||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||
その他(別言語等)のタイトル | ||||||||||||||||||||||||
その他のタイトル | Incorporation of Mixed Excitation Model and Postfilter into HMM-Based Text-to-Speech Synthesis | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
著者 |
吉村, 貴克
× 吉村, 貴克
× 徳田, 恵一
× 益子, 貴史
× 小林, 隆夫
× 北村, 正
|
|||||||||||||||||||||||
著者別名 | ||||||||||||||||||||||||
姓名 | Tokuda, Keiichi | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
姓名 | 徳田, 恵一 | |||||||||||||||||||||||
言語 | ja | |||||||||||||||||||||||
姓名 | トクダ, ケイイチ | |||||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||||
著者別名 | ||||||||||||||||||||||||
姓名 | Kitamura, Tadashi | |||||||||||||||||||||||
bibliographic_information |
ja : 電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 巻 J87-D2, 号 8, p. 1565-1571, 発行日 2004-08-01 |
|||||||||||||||||||||||
出版者 | ||||||||||||||||||||||||
出版者 | Institute of Electronics, Information and Communication Engineers | |||||||||||||||||||||||
言語 | en | |||||||||||||||||||||||
ISSN | ||||||||||||||||||||||||
収録物識別子タイプ | ISSN | |||||||||||||||||||||||
収録物識別子 | 0915-1923 | |||||||||||||||||||||||
item_10001_source_id_32 | ||||||||||||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||||||||||||
収録物識別子 | AA11340957 | |||||||||||||||||||||||
出版タイプ | ||||||||||||||||||||||||
出版タイプ | VoR | |||||||||||||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||||||||
内容記述 | ||||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||||
内容記述 | 本論文は,HMMに基づいた音声合成システムに混合励振源モデルを導入することにより,合成音声の品質向上を図ることを目的とする.我々はこれまでに,メルケプストラム,基本周波数,継続長をHMMの枠組みでモデル化し,HMMからこれらの音声パラメータを出力することによって音声を合成するテキスト音声合成システムを提案した.このシステムでは,合成フィルタ(MLSAフィルタ)を励振する際の励振源モデルとして,有声区間,無声区間でそれぞれパルス列と白色雑音を切り換える単純なモデルを用いている.このような励振源を用いる場合,有声摩擦音のように周期成分と非周期成分をともにもつ音声を合成することができず,合成音声の品質を劣化させる原因となる.そこで本論文では,パルス列と白色雑音を混合する混合励振源モデルを用いることにより高品質な音声を実現している狭帯域音声符号化手法MELPの混合励振源モデルを導入する.この混合励振源モデルは,狭帯域音声符号化だけでなく,広帯域音声符号化へも応用されていることから,音声合成においても有効性が期待される.更に,多くの音声符号化手法で用いられているポストフィルタを導入し,合成音声の品質を向上を図る.また主観評価実験により,本システムにおける混合励振源モデルとポストフィルタの有効性を示す. | |||||||||||||||||||||||
言語 | ja |