講演・口頭発表等 - 北村 達也
-
ATR音声データベースセットCの文音声の個人性類似度(学生ポスターセッション,音声アプリケーション,一般)
川元 広樹, 北村 達也
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2013年2月
ATR音声データベースセットCの関東出身男性話者20名による文音声を対象にして聴取実験に基づき音声の個人性の類似度評価を行った。実験協力者40名を対象に2話者の文音声を聴かせ、その類似度を評定させた。得られた結果を多次元尺度構成法により処理して話者を知覚空間上に布置した。
-
破裂子音および摩擦子音発声時の声道容積変化の計測(一般セッション,福祉と音声処理,一般)
北村 達也, 波多野 博顕
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2012年11月
有声,無声の破裂子音および摩擦子音生成時の声道容積の変化を計測した.成人男性1名を対象にしてこれらの子音を含む3モーラの無意味語生成時の3次元MRI動画を観測し,声道内に閉鎖もしくはせばめが形成されている時間区間の声道容積を計測した.その結果,有声破裂子音/d/生成時の声道閉鎖時の声道容積はほぼ単調に増加し,その値は常に無声破裂子音/t/よりも大きかった.また,有声破裂子音/d/と有声摩擦子音/z/の生成時の声道容積を比較すると,前者の方が最大値と増加幅が大きいという結果が得られた.
-
声道の局所的伸縮による話者正規化(聴覚・音声・言語とその障害,一般)
北村 達也, 竹本 浩典, 足立 整治
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2010年2月
Vocal tract length sensitivity functionを用いて声道伝達関数の話者正規化を試みた.Vocal tract length sensitivity functionとは,声道の長さ方向の局所的伸縮がフォルマント周波数に与える影響を求める関数である.これを用いて成人男性6名の日本語5母音の第1から第4フォルマント周波数が目標話者のものと一致するよう声道断面積関数を変形した.そして,元の声道断面積関数から変形後への写像として声道ワーピング関数を求めた.その結果,(1)得られた声道ワーピング関数の形状は線形ではない,(2)変形後の声道断面積関数の声道長は目標話者のものと異なる,(3)各母音の声道ワーピング関数は話者内でも形状が異なる,ということが明らかになった.
-
A6.情動による声道形状変化のMRI観測(研究発表,音声学会2009年度(第23回)全国大会発表要旨)
北村 達也
音声研究
開催年月日: 2009年12月
-
MRIに基づく音声生成の研究手法の概要(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
竹本 浩典, 北村 達也
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2009年6月
MRIは音声生成の研究に有用なツールである.近年,声道を精密に計測する撮像法が開発され,誰もが利用できるようになっている.しかし,MRIを用いた音声研究はまだ少数である.それはMRIの特性とそのデータ処理に関する情報が不足しているからであると考えられる.そこで本稿では,音声生成研究で利用されている3種類の撮像法,通常撮像法,発話同期撮像法,動画撮像法と,そのMRIデータの処理過程について概説する.また,声道の音響解析手法として縦続円筒管モデル,時間領域差分法を紹介する.そして,MRIを用いた音声研究の今後の展望について述べる.
-
母音発話MRIデータに基づく声道模型の音響特性(立体音響・トランスデューサ/一般)
北村 達也, 竹本 浩典, 本多 清志
電子情報通信学会技術研究報告. EA, 応用音響
開催年月日: 2007年11月
ATR母音発話MRIデータから抽出した声道の音響特性を明らかにするために,このMRIデータから日本語5母音の声道模型を光造形により作製し,その音響特性を測定した.声道模型の口唇部から入力したOptimized Aoshima's time-stretched pulse (OATSP)信号を声門部に固定したプローブマイクで収録し,声道模型の音響特性を求めた.この測定手法を用いることによって,声門閉鎖時に出現する喉頭腔共鳴を含む声道音響特性を測定することができた.得られた測定結果は,各種の声道音響解析手法に対して,精度を検証するための基準値の1つとなる.
-
物真似タレントによる物真似音声の分析(合成,生成,韻律,一般)
北村 達也
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2007年10月
物真似音声が似ていると知覚される要因を調べるため,プロの物真似タレントによる物真似音声と対象話者の音声を比較した.2つの文章音声を分析した結果,基本周波数の平均値は対象話者の音声より20Hz前後高く,その変動パターンはこれらの話者の間でよく似ていた.スペクトルに関しても,その概形や第1,第3,第4ホルマント周波数が対象話者のもに近付けられていた.さらに,声帯音源特性を表す,DFTスペクトルの第1,第2調波の振幅差(H1-H2)もこれらの話者間で近い値を示した.一方,第2ホルマント周波数は話者間で異なっており,音節継続時間長は対象話者のものに近付ける傾向が見られなかった.
-
MRIによる歯列計測法 : 熱可塑性エラストマー製マウスピースを用いて
北村 達也, 平田 宏之, 本多 清志, 藤本 一郎, 島田 育廣, 正木 信夫, 西川 員史, 福井 孝太郎, 高西 淳夫
電子情報通信学会技術研究報告. MI, 医用画像
開催年月日: 2007年7月
熱可塑性エラストマーを成形してマウスピースを作り,これを用いて磁気共鳴画像法(MRI)により歯列形状を計測する手法を開発した.この素材には食品用パラフィンが混ぜ合わされているため,MRIによって高輝度に造影される.また,真空状態で成形するため,マウスピースに気泡が入りにくく,その結果ムラのないMR画像が得られる.一方で,歯列は低輝度に造影されるため,マウスピースとの間にコントラストが生じ,歯列形状を抽出することができる.
-
声門開放時の声道共鳴特性(聴覚・音声・言語とその障害,一般)
竹本 浩典, 北村 達也, モクタリ パーハム, 足立 整治, 本多 清志
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2007年3月
日本語5母音の声道断面積関数を用いて,声門インピーダンスを考慮することにより,声門開放が伝達関数に及ぼす影響を解析した.声門が開放すると声道共鳴は開管共鳴に近づくため,第1フォルマントは上昇する.喉頭腔共鳴の周波数が上昇しながら弱まるため,喉頭腔共鳴の誘導する第4フォルマントは周波数が上昇しながら減衰して消失する.その他のフォルマントでは,体積速度の節が喉頭腔と咽頭腔の境界に現れるため,声道共鳴は喉頭腔を除いた声道の閉管共鳴で近似できる.
-
単母音の音響特徴量の変化が個人性知覚に与える影響(聴覚・音声・言語とその障害,一般)
北村 達也, 齋藤 毅
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2007年3月
サーストンの一対比較法により各種特徴量の個人性知覚に関する寄与の間隔尺度を求めた.成人男性話者10名が発話した短母音/a/の中の特徴量を変化させ,それが個人性の近さの判断に及ぼす影響を調査した.加えて,刺激音の音質の主観評価実験も行い,刺激音に加えた操作による音質の劣化と上記の実験の結果との相関を求めた.これらの実験により,音声スペクトルの高周波数成分,声帯音源の周波数特性,平均基本周波数,基本周波数と振幅の時間変動パターンの順序で個人性の近さの判断に対する寄与が大きいという結果が得られた.ただし,個人性の近さに関する間隔尺度と音質に関する間隔尺度との間には強い相関があり,刺激音の音質が実験結果に影響を与えた可能性が示唆された.
-
声帯振動に伴う喉頭腔共鳴の周期性(音声・聴覚,一般)
北村 達也, 竹本 浩典, 足立 整治, モクタリ パーハム, 本多 清志
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2006年7月
声帯振動に伴う声門開口面積の変化が喉頭腔で生じる共鳴(喉頭腔共鳴)に与える影響を調査した.成人男性3名の日本語5母音発声時の声道伝達特性を声門閉鎖および開放の条件で計算した結果,喉頭腔共鳴は声門閉鎖時にのみ3.0kHzから3.7kHzの周波数帯域に生じ,声門開放時には消失することが明らかになった.さらに,母音の実音声の声門閉鎖および開放区間を対象としたスペクトル分析によって,喉頭腔共鳴がピッチ周期内で出現と消失を繰り返すことが示された.これらの現象は,声門閉鎖時には喉頭腔が閉管となることにより喉頭腔共鳴が生じ,声門開放時には喉頭腔が開管となることにより喉頭腔共鳴が消えると説明できる.
-
喉頭腔の音響特性(一般, 一般, チュートリアルレクチャー)
竹本 浩典, 足立 整治, 北村 達也, 本多 清志, モクタリ パーハム
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2005年5月
喉頭腔の音響特性を求めるため, 5母音の声道断面積関数を用いて共鳴モード解析を行った.その結果, 喉頭腔の共鳴周波数付近では, 喉頭腔と咽頭腔との接続部で体積速度が増大するため, 喉頭腔を除く声道部分(主声道)に両端を開口端とする共鳴モード(開管共鳴)が生じることが示され, その共鳴は本研究に用いた声道では第4フォルマントであった.それ以外のフォルマントでは喉頭腔と咽頭腔との接続部における体積速度が小さいため, この部分を閉鎖端として主声道に片開き管の共鳴モード(閉管共鳴)が生じることも明らかになった.
-
F_0 変化に伴う声道形状変化の観測
北村 達也, パーハムモクタリ
電子情報通信学会技術研究報告. EA, 応用音響
開催年月日: 2005年3月
F_0の変化に伴う母音/a/および/i/発声時の声道形状の変化を3次元MRIにより観測した.成人男性1名に110, 123, 130, 146, 164 Hzの純音を呈示し, それにピッチ周波数(F_0)を合わせて持続発声させてMRI撮像を行った.声道断面積関数を分析した結果, 母音/a/においてF_0変化に伴う口腔の断面積関数の変化が顕著であり, F_0と口腔の体積との間に強い負の相関があることが明らかになった.また, 母音/i/においてはF_0の変化に伴って咽頭腔の断面積関数の変化が顕著であり, F_0と咽頭腔の体積との間に負の相関があることが明らかになった.
-
ボクセルメッシュを用いた有限要素法による声道の音響解析(一般)
北村 達也, 竹本 浩典, 本多 清志
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2004年11月
日本語5母音の声道形状を対象にして有限要素法を用いて音響解析を行った.3次元MR画像から抽出した声達領域を2×2×2mmのボクセル要素(立方体の6面体要素)を用いて分割して有限要素モデルを作成した.この方法はMRIのボリュームデータのボクセルを有限要素として用いるので,有限要素モデルを簡便に作成することができる.本研究では,この有限要素モデルの伝達関数のピーク周波数と実音声のホルマント周波数との比較を行った.また,歯列間隙,喉頭蓋谷,および喉頭腔を除去した有限要素モデルを作成し,これらの微細構造が伝達特性に与える影響を調査した.その結果以下のおとが明らかになった.(1)有限要素モデルの伝達特性のピーク周波数と音声データのホルマント周波数は母音/u/以外は大局的に一致した.(2)歯列間隙および喉頭蓋谷は声達の伝達特性に谷を生じさせた. (3)母音/a/の有限要素モデルにおいて喉頭腔は第4ピークを生じさせた.
-
座位および仰臥位における声道形状の相違 : 開放型MRI装置を用いた観測(生成,認識、音響心理)(音声の基礎と応用シンポジウム)
北村 達也, 竹本 浩典, 本多 清志, 島田 育廣, 藤本 一郎, 赤土 裕子, 正木 信夫, 黒田 輝, 奥内 昇, 千田 道雄
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2004年6月
体位の変化が母音発声に与える影響を明らかにするため,開放型MRI装置を利用して正中矢状断面のMR画像を観測した.成人男性3名を対象にして座位および仰臥位での日本語5母音の持続発声時の撮像を行った.硬口蓋を基準とした体位間の比較の結果,仰臥位では舌がより後方に移動し,軟口蓋と口唇にも重力の影響がみられた.大きな舌の移動は前舌母音よりも後舌母音にて現れる傾向があった.一方,座位では頚椎と咽頭後壁が前方に移動した.これは重力よりも順位による影響であると考えられた.また,撮像と同時に収録した音声を分析したところ,体位間の差異は約1.5 kHz以上の周波数帯域で顕著であった.
-
MRI計測による声道モデルの伝達特性の推定精度の検討(聴覚・音声・言語とその障害)
西本 博則, 赤木 正人, 北村 達也, 鈴木 規子
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2004年3月
MRI計測から得られる声道モデルの伝達特性の推定精度の検討を行った.推定法としては,有限要素法,および断面積関数を用いたSondhiにより提案された推定法を用いた.被験者は健常な男性2名と口腔疾患を有する男性1名である.声道モデルの伝達特性を各推定法から求め、そのピーク周波数と音声のフォルマント周波数との比較を行った.その結果,健常者の場合は伝達特性の共振周波数の数と音声のフォルマントの数が一致し,また,伝達特性の共振周波数と音声のフォルマント周波数の差は小さく,伝達特性が精度良く推定されていることがわかった.一方,患者の場合は有限要素法による推定結果は良好であったが、一次元声道モデルではフォルマントの数が一致しなかった。これは、患者の声道形状が複雑であるため、一次元声道モデルにするとその特徴が失われるためであると考えられる。
-
音響計測、電気回路理論および有限要素法により求めた声道模型の伝達関数の比較(音響と音声処理,音声強調,ロバスト音声認識)
北村 達也, 西本 博則, 藤田 覚, 本多 清志
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2003年4月
有限要素法により得られる声道の伝達関数の精度を調べるために,単純な形状の音響管を対象にして音響計測と電気回路理論と有限要素法(FEM)により求めた伝達関数の比較を行った.一様音響管を対象とした場合,これらの3つの方法で求めた共鳴周波数がほぼ一致した.Chiba and Kajiyamaの声道模型のレプリカを対象とした場合には,理論値と有限要素法により求めた伝達関数はほぼ一致した.従って,本研究で対象とした音響管に関しては,FEMによりほぼ正確な結果が得られることが示された.しかし,音響計測により求めた伝達関数には,3kHz以上の帯域でピークがみられず音響計測の方法に何らかの問題があることが示唆された.
-
日本語対話者声の意味的強調の判断における文脈および語順の影響
北村 達也, 伊藤 佳世, 伊藤 敏彦, 北澤 茂良
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2002年4月
意味的強調を含む対話音声を対象として,対話の文脈や語順が焦点の判断に与える影響について聴取実験を行った.「大阪へ自動車で行きます.」と「自動車で大阪で行きます.」という語順の異なる2つの文章に関して,どの文節も強調しない,「大阪へ」を強調する,「自動車で」を強調する,という3つの文脈で音声を収録した.そして,これらの音声を,「明日,どちらに行かれるんですか?」,「明日,何に乗って行かれるんですか?」という2つの質問文と組み合わせて呈示し,どの文節に焦点があたっているかを被験者に回答させた.その結果,本研究の実験条件のもとでは,(1)焦点の判断には文脈よりも韻律的特徴が寄与する,(2)焦点の判断には文脈の影響がある,(3)焦点の判断に語順が影響を与える可能性がある,ということが示された.
-
韻律データベース構築のための韻律に基づく韻律句ラベリング
北村 達也, 伊藤 敏彦, 望月 和也, 北澤 茂良
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2002年1月
日本語韻律データベースを構築するために, 詳細なセグメンテーションを行った.この韻律データベースには, 東京方言の男女各3人により発声された, 朗読発話と模擬自発発話が収録されている.音声データのセグメンテーションの単位は, 言語音声知覚単位として定義される「韻律句」とした.正確にセグメンテーションを行うために, 従来用いられてきた広帯域スペクトログラムに加え, 狭帯域スペクトログラムも用いて, 音声波形振幅の変化, 基本周波数の変化, 高次も含めたフォルマント振幅の変化を総合して韻律的セグメントの候補を決定し, さらに1基本周期単位の時間調整を行って最終的に聴取によって「切れ具合」を確認した.さらに, 全データを1人が精査することにより, セグメンテーションに関する一貫性を目指している.
-
MRIによる舌・口底切除患者の3次元声道形状の分析
北村 達也, 鈴木 規子, 齋藤 浩人, 道 健一, 高橋 俊行, 赤木 正人, 和久本 雅彦
電子情報通信学会技術研究報告. SP, 音声
開催年月日: 2001年3月
舌・口底切除患者の発声時の声道形状の特徴を調べるために,MRIを用いて3次元声道形状を抽出した.被験者は舌・口底切除患者1名,口底切除患者1名,および健常人2名で,被験音は/i/である.患者の声道形状の特徴として,正中矢状面に対する非対称性に着目し,健常人の声道形状との形状比較を行った.形状比較は口蓋部および咽頭部にて行った.その結果,患者の声道断面形状には手術の影響による顕著な非対称性が見られることを示した.これは,患者の異常な音声の要因の1つである可能性がある.