Papers - KITAMURA Tatsuya
-
学習履歴管理機能を持つ日本語読解支援システムの開発とその評価
北村達也, 川村よし子, 内山潤, 寺朱美, 奥村学
日本教育工学雑誌 23 ( 3 ) 127 - 133 1999
-
Significant cues in spectral envelope of isolated vowels for speaker identification
Kitamura Tatsuya, Akagi Masato
The Journal of the Acoustical Society of Japan 53 ( 3 ) 185 - 191 1997.3
Joint Work
Publisher:一般社団法人日本音響学会
単母音のスペクトル包絡において個人性が顕著に現れる帯域とその帯域において話者識別に寄与する成分についての検討を行った.スペクトル包絡の特定の帯域を変形させた刺激音を用いた聴覚実験により, スペクトル包絡の変形と個人性知覚との定量的な関係を求めた.その結果, 以下のことが明らかになった.(1)個人性はスペクトル包絡全体に現れるが, 高域により多く現れる.(2)話者識別にはスペクトル包絡のdipよりもpeakが重要な意味を持っている.(3)個人性は音韻によらずスペクトル包絡の20 ERB rate (1,740Hz)付近に存在するpeak以上の帯域に顕著に現れる可能性が高く, この帯域を利用して話者変換が可能である.(4)この帯域のpeakを3角形で近似しても個人性が保存される.
-
Speaker individualities in speech spectral envelopes
Tatsuya Kitamura, Masato Akagi
Journal of the Acoustical Society of Japan (E) 16 ( 5 ) 283 - 289 1995.9
Joint Work
The aim of the three psychoacoustic experiments described here was to clarify whether there are speaker individualities in the spectral envelopes, in which frequency bands such individualities exist, and how frequency bands having speaker individualities can be manipulated. The LMA analysis-synthesis system was used to prepare stimuli varied specific frequency bands, and the frequency bands having speaker individualities were estimated expermentally. The results indicate that (1) speaker individualities exist in spectral envelopes, (2) these individualities are mainly at frequencies higher ...
DOI: 10.1250/ast.16.283
-
離散分布型HMMによる単語音声認識におけるビタビbest-firstサーチの検討
好田正紀, 北村達也
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 77 ( 7 ) 1187 - 1197 1994
Joint Work
HMMによる音声認識をグラフサーチの問題とみなし,ビームサーチの技法を利用して,当該節点までのスコアのみに基づく枝刈りや,forward-backwardサーチのようにより単純なモデルを用いた認識処理に基づく当該節点以降の推定スコアも考慮した枝刈りが検討された.また,best-firstサーチの技法を利用して,スタックデコーディング法のように厳密なA探索に必ずしもこだわらない実用的な探索法や,tree-trellisサーチのようにN-best候補の探索に対して高速化を図る方法が検討された.本論文では,best-firstサーチの技法を利用して,HMMのビタビアルゴリズムによる認識処理に対して高速化を図る方法を検討し,最大経路スコアに基づく推定スコア設定法および単純な音素HMMを利用する推定スコア設定法を提案した.ビタビbest-firstサーチは,推定スコアを適切に設定すれば,認識率を低下させずに,認識処理で主要な部分を占める経路展開の計算量が1%以下となり,計算量低減の効果が非常に大きいことを示した.単純な音素HMMを利用する推定スコアは,時間軸の順序関係が考慮されるので精度が良いが,推定スコア設定に大きな計算量を必要とする.経路展開の計算量と推定スコア設定の計算量の両方を考慮すると,単語内最大経路スコアに基づく推定スコアが最も良い.この推定スコアは,A探索の条件を満たすので,最適解も保証される.