WEKO3
アイテム
HMMに基づいた極低ビットレート音声符号化における不特定話者への対応
https://nitech.repo.nii.ac.jp/records/5108
https://nitech.repo.nii.ac.jp/records/510897a2a326-5267-4ab2-ad08-bea37d4d1aee
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 IEICE http://search.ieice.org/index.html
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2012-11-07 | |||||||||||||||||||||
タイトル | ||||||||||||||||||||||
タイトル | HMMに基づいた極低ビットレート音声符号化における不特定話者への対応 | |||||||||||||||||||||
言語 | ja | |||||||||||||||||||||
言語 | ||||||||||||||||||||||
言語 | jpn | |||||||||||||||||||||
資源タイプ | ||||||||||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||||||||||||||
資源タイプ | journal article | |||||||||||||||||||||
その他(別言語等)のタイトル | ||||||||||||||||||||||
その他のタイトル | HMM ニモトズイタ キョクテイ ビットレート オンセイ フゴウカ ニオケル フトクテイ ワシャ ヘノ タイオウ | |||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||
その他(別言語等)のタイトル | ||||||||||||||||||||||
その他のタイトル | Very Low Bit Rate Speech Coding Based on HMM with Speaker Adaptation | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
著者 |
益子, 貴史
× 益子, 貴史
× 小林, 隆夫
× 徳田, 恵一
|
|||||||||||||||||||||
著者別名 | ||||||||||||||||||||||
姓名 | Tokuda, Keiichi | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
姓名 | 徳田, 恵一 | |||||||||||||||||||||
言語 | ja | |||||||||||||||||||||
姓名 | トクダ, ケイイチ | |||||||||||||||||||||
言語 | ja-Kana | |||||||||||||||||||||
書誌情報 |
ja : 電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 巻 J85-D2, 号 12, p. 1749-1759, 発行日 2002-12-01 |
|||||||||||||||||||||
出版者 | ||||||||||||||||||||||
出版者 | Institute of Electronics, Information and Communication Engineers | |||||||||||||||||||||
言語 | en | |||||||||||||||||||||
ISSN | ||||||||||||||||||||||
収録物識別子タイプ | ISSN | |||||||||||||||||||||
収録物識別子 | 0915-1923 | |||||||||||||||||||||
item_10001_source_id_32 | ||||||||||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||||||||||
収録物識別子 | AA11340957 | |||||||||||||||||||||
出版タイプ | ||||||||||||||||||||||
出版タイプ | VoR | |||||||||||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||||||
内容記述 | ||||||||||||||||||||||
内容記述タイプ | Other | |||||||||||||||||||||
内容記述 | 本論文では,HMMを用いた音声認識,音声合成に基づく極低ビットレート音声符号化方式であるHMM認識ボコーダにおける不特定話者への対応手法について検討する.HMM認識ボコーダでは,符号化音声の声質が復号化器において音声合成に用いるHMMのみによって決まるため,不特定の入力話者に対応するためには復号化器のHMMを入力音声に適応させる必要がある.そこで本論文では,音声認識により入力パラメータ列に対応づけられたHMMの出力分布列の平均ベクトルを,セグメントごとにパラメータ空間上で一様に並行移動させることにより,入力音声に適応する手法を提案する.この移動量をここでは移動ベクトルと呼び,符号化器においてこの移動ベクトルを求め,量子化して伝送する.主観評価実験により,提案手法で移動ベクトルを100 bit/s程度となるように量子化し不特定話者HMMを適応した場合に入力話者の音声データで学習した特定話者モデルを用いた場合と同等の音質となることを示した. | |||||||||||||||||||||
言語 | ja |