next up previous
: 4. 話者移行型の出現分布の予測 : 円滑な話者交替はいかにして成立するか 会話コーパスの分析にもとづく考察 : 2. 話者交替に対する2つの立場



3. 方    法

3.1 分析資料

千葉大学地図課題対話コーパスHoriuchi99より, 異なる16人の話者による8つの対話(各対話5分ずつ計40分)を分析に利用した. ただし,同時開始型,沈黙型発話は出現頻度が少ないため, 上記8対話に加え, 同コーパスより同じ話者による対話を話者ごとに3対話ずつさらに選択し, そこに出現した同時開始型,沈黙型発話も利用した4

3.2 話者移行型

分析の基本単位として, 100msより長い無音によって区切られた一連の音声区間である 間休止単位(Inter-Pausal Unit,IPU)を利用する[Koiso, Horiuchi, Tutiya, Ichikawa, DenKoiso et al.1998]. 発話音声のパワー情報をもとに自動的に無音区間を抽出し, IPUへの分割を行った. 隣接する2つあるいは3つのIPUを対象に, 各IPUの話者とそれらの時間的関係から 話者の移行型を以下のように定義した(図 4).

交替型
隣接する2つのIPUが異なる話者であり, かつそれらが時間的に重複していない場合.
非交替型
隣接する2つのIPUが同じ話者の場合.
同時開始型
開始時刻がほぼ同じ(200ms以内の差)である2つのIPUが後続する場合.
沈黙型
隣接する2つあるいは3つのIPUの間の時間が1700msより大きい場合5

図: 話者移行型
[3]#1#2#3
10#10

11#11

12#12

13#13


沈黙型とは, ある話者が発話を終了した後に誰も発話を開始しない状態, つまりいずれの話者も発話をせずに``間があいた''と感じられる状態のことであり, 本稿では「通常の交替,非交替時の移行に要する時間よりも十分に長いもの」と とらえる. 話者16名それぞれに対して交替,非交替時の移行時間を求め, 平均と標準偏差を算出し平均24#241.5標準偏差の値を話者ごとに算出したところ, 16名の話者に対するその平均は1670msであった (以上の計算はデータの分布の正規性を満たすために生データを対数変換してから 行った). そこで1700msを閾値とし,移行時間がそれよりも長い場合を「沈黙型」と定義した.

またあいづちへの移行,あるいはあいづちからの移行は 他の実質的な発話の移行とは異なる性質を有する可能性があるため, あいづちを含む対は分析から除外した. あいづちの判断は,形式的,機能的特徴にもとづいて 2人の作業者が独立に行い, 一致しなかったものに関して相談の上決定した. 具体的には,「はい」や「ええ」,「うん」といった表現のうち, 質問に対する返答や依頼に対する応諾のような談話行為機能を有さないものを あいづちとして認定した[野口野口1998].

3.3 素性値

分析には,文末,あるいは非文末を特徴付けると考えられる 以下の6つの素性を利用する.

韻律素性値の文末らしさ F0は通常,平叙文では文末に向けて下降することが, 疑問文では上昇調となることが知られている. このことから 下降,上昇以外の特徴は逆に文中に多く出現することが予測される. Koori96は,「尻上がり」のイントネーション, つまり文節末のモーラで上昇し途中で下降する音調は, 文末以外の文節末に多くみられることを指摘している. またPierr90は, F0の下降の程度が「終わりらしさ」 の程度を反映することを指摘しており,下降しないパターン, つまり平坦なパターンは文中に出現する傾向にあることが示唆される. パワーに関しても, F0と同様に文末では低下する傾向にあることが指摘されている. またKoori96は, 文節末の単母音の延伸は非文末を特徴付けること, 逆に文末では母音はそれ程伸びないことを指摘している.

以上の知見にもとづき,各韻律素性値を 表 1 のように 文末型 非文末型 曖昧型に分類した.


表: 各素性値の文末らしさから見た分類
  文末型 曖昧型 非文末型 F0形状  

統語素性値の文末らしさ 統語素性に関しても同様に3つの型に分類した. 書き言葉の場合, 用言の終止形や命令形,終助詞の出現は 文末を特徴付ける. しかし,Maynard93やHayashi96が指摘するように, 日本語の話し言葉には省略が頻繁に生じるため, 用言や主節などが省略されている場合も文になり得る. 地図課題対話においても確かに省略が多く, たとえば「水車小屋へはどうやって行くの」という質問に対して, 「湖の所を右/湖の所を右に/湖をまわりこむように」 といった用言の省略された応答や, 「こっちの地図には水車小屋ってないんですけれども」 といった主節の省略された応答が数多く出現する. これらの例からもわかるように, 名詞や格助詞,用言連用形,接続助詞といった 主に節や句を構成する要素は文末にも出現しやすくなる. そのためこれらの要素は曖昧型とする.

一方,連体詞や用言連体形は, 被連体修飾要素の後続を必要とするため, 文末に出現することはない. 接続詞に関しても同様である. そこでこれらの要素は非文末型とする. 「えっと」や「あのー」といったフィラーは 言い淀み時に出現することから同様に非文末型とする. また「はい」や「こんにちは」といった感動詞に関しては, 単独でも文と考え,文末型に分類する. 以上の分類を表 1 にまとめる.

ラベリング 以下の手順で各素性値のラベリングを行った (ラベリング方法の詳細についてはKoiso99を参照).

まずF0曲線,パワー曲線,スペクトログラムを 音響分析ソフトウェアESPS/Waves24#24を利用して抽出し, それらを参照しながらIPU末1モーラ,1音素の切り出しを手作業で行った. F0,パワー曲線の形状に関しては, それぞれ最後1モーラ,1音素のプロット値を最小2乗法により2本の折線で近似し, その傾きから自動的にラベリングを行った後, 各曲線の描画イメージと原音声にもとづき修正を行った. 最大F0,最大パワーは音響分析プログラムのプロット値から 自動的に素性値を決定した. なおF0,パワーの値は話者ごとにレンジで正規化したものを用いた. 品詞に関しては,2人の作業者が独立に付与したのち, 一致しなかったものに関しては相談の上決定した. F0のプロット値が正確に抽出できなかったものや 言い淀みなどにより単語が途中で途切れているものは分析から除外した. 結果,交替型,非交替型,同時開始型,沈黙型としてそれぞれ 366, 500, 162, 166個のIPU対が得られた.


next up previous
: 4. 話者移行型の出現分布の予測 : 円滑な話者交替はいかにして成立するか 会話コーパスの分析にもとづく考察 : 2. 話者交替に対する2つの立場
日本認知科学会論文誌『認知科学』