講演・口頭発表等 - 北村 達也
-
舌・口底切除における異常構音の音響的特徴 : スペクトルのピーク分析の試み
齋藤 浩人, 鈴木 規子, 北村 達也, 赤木 正人, 道 健一
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 1999年3月
健常例 2 例、舌・口底切除施行例 15 例を対象とし日本語母音 /i/ 発音時の音声からの不偏推定法によってケプストラム平滑化対数スペクトルを求め、比較検討を試みたところ以下のような結果が得られた。1) 古口底切除症例では F1 が高い値を示す傾向であった。2) 舌口底切除症例では 2〜3kHz の帯域のピークの形状は様々であり、健常人にはみられない異常な形状を示す症例が過半数を占めていた。3) 舌口底切除症例では 2〜3kHz の帯域において時間経過に伴いスペクトルのピークのゆらぎを示す症例がみられた。今回の結果より本疾患症例の音響分析に際して時間経過を考慮した方法を用いることの必要性が示唆された。
-
話者識別に寄与するスペクトル包絡の成分について
北村 達也, 赤木 正人
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 1996年3月
単母音のスペクトル包絡において話者識別に寄与する成分を聴覚実験により検討した。実験には、LMA分析合成系を利用してスペクトル包絡を種々変形した音声を用いた。その結果、話者識別にはスペクトル包絡のくぼみよりもピークが重要な意味を持っていることを明らかにした。また、スペクトル包絡における個人性は音韻によらず約20 ERB rate (1740 Hz)付近に存在するピーク以上の帯域に顕著に現れることを明らかにした。さらに、この帯域のピークを三角形により近似しても音声の個人性は保存される。この結果は、話者識別にはスペクトル包絡の高域のピークの周波数とバンド幅が重要である可能性が高いことを示唆している。
-
個人性情報を含む周波数帯域について
北村 達也, 高木 直子, 赤木 正人
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 1995年7月
単母音のスペクトル包絡において個人性が顕著に現れる帯域をABX法により調査した。実験には、個人性を平均したスペクトル包絡の0〜10、10〜20、20〜30ERB rate(0〜442、442〜1740、1740〜5544Hz)の帯域をある話者のものと入れ換えたスペクトル包絡を持つ音声を用い、話者識別率と入れ換えた帯域との関係を調べた。実験の結果、音声の個人性はスペクトル包絡の高域成分により多く存在し、この成分を利用することにより話者変換の効果が得られることが明らかになった。また、個人性を平均したスペクトル包絡とのスペクトル距離が大きい帯域ほど話者変換の効果が大きいことが明らかになった。
-
音声のスペクトル包絡に含まれる個人性について
北村 達也, 赤木 正人
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 1994年3月
単母音のスペクトル包絡における個人性について聴取実験による検討を行った。実験には、LMA分析合成系を使用してスペクトル包絡を種々変形した音声を用いた。第1に、スペクトル包絡に個人性が含まれることを確認した。第2に、スペクトル包絡の微細構造と個人性の関係を調べる実験を行い、話者の識別には母音の識別よりも細かいスペクトル包絡の情報が必要であることを明らかにした。第3に、スペクトル包絡の帯域と個人性の関係を調べる実験を行い、単母音のスペクトル包絡における個人性は22FRB Rate(2212Hz)以上の帯域、母音の特徴は12ERB Rate(603Hz)〜22ERB Rateの帯域に顕著に現れ、それらは独立に制御可能であることを明らかにした。