第62回 人工知能学会 言語・音声理解と対話処理研究会 (SIG-SLUD)




日時：2011年7月22日(金) 13:00--17:50
　　　2011年7月23日(土) 11:00--16:55

会場：九州工業大学情報学部 MILAiS
　　　（〒820-8502 福岡県飯塚市川津 680-4）
　　　アクセスマップ: http://www.iizuka.kyutech.ac.jp/public/access/
　　　キャンパスマップ (8 インタラクティブ学習棟): http://www.iizuka.kyutech.ac.jp/public/map/

参加費：無料

資料集代： 1,500円
ただし人工知能学会の学生会員には無料で配布します．
SLUD研究会登録会員は事前送付される予稿集をお持ち下さい．

プログラム：
------------------------------------------------------------
発表件数 16 件

7月22日 (金) 13:00--17:50
[13:00-15:20]　韻律 (4 件)
[15:30-17:50]　言語学 (4 件)

7月23日 (土) 11:00-16:55
[11:00-12:10] マルチモーダル-1 (2 件)
[13:15-15:00] 会話研究 (3 件)
[15:10-16:55] マルチモーダル-2 (3 件)
------------------------------------------------------------


[7/22 (金) 13:00-15:20]　韻律セッション (4 件)（1 件 35 分：25 分講演, 10 分質疑）

1. 話し言葉にみられる接続助詞の音調　ー１モーラ接続助詞の場合ー
◯田頭 (谷口) 未希 (東海大)

『日本語話し言葉コーパス』（CSJ）を利用し、韻律句末で１モーラの接続助詞
（「が」「し」「て」「と」「ば」など）がとる音調と、その意味・用法や談
話構造という点からみた機能などとの関係について分析、考察を行う。CSJで分
類される１モーラの接続助詞は6種類で、そのうち「で」はその表出頻度が極端
に低いため分析対象からは除外し、残りの「が」「し」「て」「と」「ば」の
5つを、特に「が」を中心に分析する。韻律句（Intermediate Phraseと
Accentual Phraseのいずれの境界においても）で表れる音調という観点からみ
ると、「が」のみが他の4つとはかなり異なる振る舞いをみせる。「が」が下降
調（L%）となる割合はわずか1割程度で、話し言葉では「が」は何らかの音調変
化を伴って発話されていることが分かる。そこでどのような音調が「が」の基
本的用法（逆接、理由や結果、条件を示す等）と結びついているのかを考察す
る。

2. 独話において上昇調はどのように使用されるか：上昇調による共通基盤の確認と談話の構造化
◯久保田ひろい (千葉大)

本稿では、質問ではない英語発話の語尾においてyes-no疑問に伴う上昇調と似
た音調が現れるという現象対象とする。具体的には、英語圏の若い女性が同年
代の視聴者に向けてメイクのチュートリアルを行う映像資料を用い、独話にお
ける上昇調の使用が談話構造とどのように関わるかを考察した。この資料の談
話構造は、導入部において簡単にメイクの説明した後に、実際にメイクをしな
がら順を追って工程を解説するというものである。各工程の冒頭において、そ
こで使用するアイテムをカメラに提示しながらその紹介を行う際に上昇調が使
用される傾向にあった。その際、話者はPC画面に視線を向け、視聴者と視覚的
な情報（アイテムの形状や色など）を共有できているかを確認していた。この
ことから、上昇調の使用は、局所的にはその工程において前提となる共有知識
の確認を行っていること、またこのような上昇調の使用が、結果として談話全
体の構造化を促しているという点を指摘する。

3. 発話末要素の有無の韻律的予測
◯石本祐一 (情報学研)，榎本美香 (東京工科大)

Sacksら(1974)により提案されている話者交替システムでは、話し手の発話の末
尾に聞き手が話し出すことができる話者移行適格場(TRP)があるとしている。こ
のTRPの手がかりとして、発話末要素と呼ばれる助動詞「です・ます」や終助詞
「ね・よ」などの統語的要素が利用可能なことがこれまで指摘されてきた。し
かし，発話末要素が存在しない発話もあるため常にTRPの決定に発話末要素が利
用できるわけではない。ところが、実際の会話を観察すると、発話末要素が出
現しない発話でも話者移行に要する時間が長くならず、遅滞なく話者交替が起
こっている。このことから、聞き手は話し手の発話に発話末要素が出現するか
否かをあらかじめ予測し、発話末要素が出現しない場合にはTRPの決定に別の手
がかりを利用していると考えられる。そこで、本研究では発話末要素の有無に
よる韻律の変化を調べ、音響的特徴から発話末要素の有無が予測できることを
示す。この結果から、韻律情報と統語情報の組み合わせが発話末の予測可能性
を向上させることが推察される。


4. 発話の「短い単位」を構成する動機付け: 情報構造の観点から
◯中川奈津子 (京都大)

本研究では、日本語の会話コーパスを用い、主に韻律情報によって客観的に分
けられた「短い単位」と情報構造の関係を探る。初めに、すでに指摘されてい
るように、再活性化される必要のある重要なトピックは、述語とは独立の短い
単位で発話されることを確認する。この現象は、Chafe (1994) の指摘するよう
に、認知的負荷の高い情報は独立の韻律単位で発話されるという動機付けの他
に、日本語の会話に特徴的な節連鎖を構成する上で有利な方策であることを指
摘する。次に、フォーカスは普通ひとまとまりの短い単位で発話されることを、
コーパスと内省などを用いて示す。具体的には、会話に広範囲に観察されるゼ
ロ助詞を例に、名詞と述語が一緒にフォーカスを構成する場合は名詞につく助
詞はゼロになる傾向があり、ひとまとまりの短い単位で発話されるが、名詞の
みがフォーカスになる場合は助詞がつく傾向があることを示す。

[7/22 (金) 15:20-15:30] 休憩

[7/22 (金) 15:30-17:50]　言語学セッション (4 件)（1 件 35 分：25 分講演, 10 分質疑）

5. 「一型アクセント」言語における疑問詞やフォーカスを含む文のピッチパターンについて--小林方言とトルコ語の対照－
◯佐藤久美子 (長崎外大)

　本発表では、「一型アクセント」言語である、小林方言とトルコ語のピッチ
パターンを派生するメカニズムについて議論する。両言語は、基本的に、語や
文節の最終音節に高いピッチが生じるというパターンを持つ。ただし、文中に
疑問詞やフォーカスがある場合、それとは異なるピッチパターンが実現する。
ここでは、疑問詞やフォーカスが複数含まれる場合や、それらが複雑な構造を
持つ文に含まれる場合のピッチパターンにも注目し、分析を行う。　文中の疑
問詞やフォーカスは音声的に卓立され、アクセントの実現に影響を及ぼすとい
うことは多くの言語で観察されている。そして、このような言語普遍的な特性
を説明するメカニズムの解明が試みられている。「一型アクセント」という類
似した特徴を持つ小林方言とトルコ語のピッチパターンを比較対照し、その異
同を明らかにすることによって、それぞれの言語の固有の特性と共に、アクセ
ントの実現に関わる言語普遍的な特性を探る。

6. 日本語文の動詞予測プロセスにおける語順の影響について
◯矢野雅貴，坂本勉 (九大)

どのような動詞が文末に出現するかという予測を行う際に、解析器が格助詞や
その組み合わせの情報を利用していることが指摘されている。しかし、「どの
語がどの順序で入力されたか」ということ、すなわち、「語順の情報」を解析
器が利用しているかどうかについてはまだ明らかになっていない。そこで本研
究では、解析器に入力される語の順序が文末動詞の予測に影響を及ぼすかどう
かについて、文完成課題を用いて検討を行った。実験は、ガニ語順条件「NPが
NPに」とニガ語順条件「NPにNPが」の1要因2水準で行われた。その結果、産出
された動詞タイプの比率が、ガニ語順条件とニガ語順条件では、有意に異なる
ことが明らかとなった。このことから、文末動詞を予測する際に、解析器が語
順の情報を利用していることが示唆された。

7. 日本語文処理における二重対格制約の心理的実在性について
◯備瀬優，坂本勉 (九大)

日本語では、主格 (?が) ・与格 (?に)・対格 (?を)などの格が明示される。
しかし、これらの格の配列にはいくつかの制約があることが知られている。そ
の一つが「二重対格制約」と呼ばれるもので、同一節内に二つ以上の対格が出
現することを禁止するものである。例えば、母親が娘に「朝食を食べる」行為
をさせた場合、「母親が娘に朝食を食べさせた。」とは言えるが、「*母親が娘
を朝食を食べさせた。」とは言えない。二重対格制約は、従来、理論的研究に
よってその存在が指摘されてきたが、実験を用いた実証的な研究によって検証
されたことはなかった。そこで本研究では、この制約の心理的実在性の有無を、
脳波の一種である事象関連電位を用いて検討した。実験の結果、二つの対格の
連続に対して、統語的逸脱に関連したP600成分が惹起された。このことから、
二重対格制約が文処理に影響を及ぼしていることが示され、その心理的実在性
が明確になった。

8. 統語論に基づく新しい意味理論の提案
◯上山あゆみ (九大)

　生成文法という考え方は、言語をいったん「伝達」という側面から切り離し
て観察することによって多くの知見をもたらしたが、そのまま言語とコミュニ
ケーションの関連に踏み込まないまま研究を進めてきたために、その知見も行
き場を失い、現在では、研究の目的が曖昧になりつつある恐れすらある。今こ
そあらためて、言語のシステムを認知モデルの中に位置づけ直し、構造という
ものが文の生成／理解という認知行為の中でどのような役割を果たしているか
を明示的にしなければならない。統語論と認知モデルをつなぐ道が建設されて
初めて、生成文法の知見が他の分野に貢献することが可能になり、また、生成
文法の研究を外部の目で評価することもできるようになる。統語論は自律的で
あるという生成文法の中心命題を評価するためにも、周辺モジュールとの関連
が具体的にされていなければならない。今回発表するものは、まだβ版の段階
であるが、だからこそ、広い視点からの意見を期待している。


[7/23 (土) 11:00-12:10]　マルチモーダルセッション-1 (2 件)（1 件 35 分：25 分講演, 10 分質疑）

9. Kinectセンサーを利用した調理場面の行為認識コンポーネントの提案 - 高次脳機能障害者支援のための環境制御技術の実装に向けて- 
◯榎本美香 (東京工科大)，野口広彰 (無所属)

高次脳機能障害者は、必要な情報を選択する収束的思考(選択的注意)や発想の
転換などといった認知機能不全のため、日常活動を達成するための個々の行為
の順序関係を間違ったり道具の選択ミスを起こす。ただし、各人の認知状態を
考慮した行為の指示や情報の提示を上手く行えば、身体的介添えなしに多くの
活動を達成できる。本研究の目的は、高次脳機能障害者の行為の選択の失敗に
素早く反応し、適切な行為への修正を促す環境制御技術を確立することにある。
その足掛かりとして、本研究では、Kinectセンサーを利用し、調理場面の三次
元空間情報から調理に必要な個々の行為(野菜を洗う・切る・炒めるなど)を特
定する行為認識コンポーネントを提案する。ここでは、1) 二次元映像から個々
の行為を人手でラベリングし、2) その行為を構成する身体各部の三次元空間情
報の時間的連接関係を解明し、3) 行為認識コンポーネントの仕様を決定する。


10. テレプレゼンスシステムを利用した手話・音声会話場面での視線一致の分析
◯菊地浩平，坊農真弓 (情報研)，中西英之 (大阪大)，黒田知宏 (京都大)

本研究発表では大規模テレプレゼンスシステムを利用した手話・音声会話場面
を対象に，物理的・空間的に異なる会場間で参与者の視線一致がどのように達
成されているのかを検討する．音声言語コミュニケーションでは音声によって
話の内容や発話の宛先が示される一方，手話言語コミュニケーションでは手指
動作が目視可能であることだけではなく参与者間で相互注視が達成されている
ことが，臨場感を共有するための1つの要素となっている．テレプレゼンス技術
は遠隔地間でのコミュニケーションに極めて高い臨場感を提供することを可能
にしているが，この視線一致については必ずしも達成可能ではない場合があ
る．本発表では参与者の着座位置によって3通りの条件を設定し，視線一致の可
能/不可能が参与者間のインタラクションにどのような影響を与えるのかを検討
する．

[7/23 (土) 12:10-13:15] 休憩

[7/23 (土) 13:15-15:00] 会話研究セッション (3 件)（1 件 35 分：25 分講演, 10 分質疑）

11. 日本語地図課題対話における話し手の意図理論の問題点
◯川端良子 (千葉大)，土屋俊 (大学評価・学位授与機構)

「話し手の意図」は多くの対話モデルにおいて必要な概念であるとされている
が、会話分析におけるいくつかの研究は、聞き手の反応が対話の流れを決定す
る重要な要因であり、話し手の意図の理解は対話の進行を決定するために必要
な概念ではないことを示唆している。しかし、話し手と聞き手が共同して一定
の目的を達成しようとして行なう課題遂行対話において、「話し手の意図」を
聞き手が解釈していないとするならば、聞き手が話し手とそもそも共通の目的
をもって目標状態に到達しようとしていることがどのようなことであるかが不
明確であるという点で、研究自体の問題設定が不明確であることになる。本研
究では、日本語地図課題対話において川端・土屋(2010)が着目した、「話し手
の意図」を聞き手が理解していないやり取りについて、それが全体の課題の目
標達成に貢献していることを示し、それがどのような仕組みによっているかを
説明するモデルを提案する。

12. 発話の実時間性：コーパス言語学と相互行為言語学からの提言
◯伝康晴 (千葉大)，小磯花絵，丸山岳彦，前川喜久雄 (国研)，高梨克也 (京都大)，榎本美香 (東工大)，増田将伸 (甲子園大)

談話において発話は実時間の中で産出され、理解される。実時間性という観点
から発話を再考すると、文法や理解過程について新たな視点を提示できる。た
とえば、発話冒頭で用いられるフィラーや語句の再開始は発話計画が完了しな
いうちから発話順番にコミットするための一つの技法ととらえられるし、日本
語の発話末に用いられる助詞・終助詞連鎖は円滑な話者交替のための空間を提
供すると同時に、産出した発話の内容を咀嚼するための時間的猶予を聞き手に
与える。筆者らはコーパス言語学と相互行為言語学の立場から、このような視
点に立って発話の文法や理解過程を定式化する試みを行なっている。本発表で
は、発話冒頭要素・発話末要素・挿入構造・発話冒頭部による行為型の予測・
漸進的発話末予測・大局的統語構造・大局的韻律構造などに関する筆者らの最
近の研究を紹介し、対話システム研究への提言としたい。


13. 実社会で自然に生起する継続的なミーティング活動のフィールド調査の狙いと工夫
◯高梨克也 (京都大)

　グループ活動の一環としてのミーティングは，同一グループ内で複数回継続
され，メンバーはそれぞれの立場に応じた参加の動機をもっている．これは従
来の対話コーパスが主に実験室環境で収録された単発の会話を対象としてきた
こととは対照的である．グループ活動支援のための情報技術の開発において
は，フィールド調査から現場でのニーズを明らかにしていくことが今後ますま
す重要になると予想される．
　発表者らは，科学館での展示改修，経営コンサルティング会社での起業計
画，サイエンスカフェ運営などのミーティング場面を対象とし，300時間以上の
ビデオ収録と書き起こしを進めてきた．本発表では，こうしたデータをもと
に，対話コーパス分析とは異なるフィールド調査の独自性を生かすための工夫
として，現在行っている次のような試みを紹介する．
・活動の長期的な流れと関係者の組織上の役割構造を把握する．
・当事者間で共有されている暗黙の前提を抽出する．
・当事者の知識や情報ではなく関心事に着目する．
・グループの変化や達成事項の記録を蓄積する．


[7/23 (土) 15:10-16:55] マルチモーダルセッション-2 (3 件)（1 件 35 分：25 分講演, 10 分質疑）

14. ポスター発表における質問者と質問の種類の 推定のためのマルチモーダルな聞き手行動分析
◯土屋貴則，河原達也，高梨克也 (京都大)

本研究では，ポスター発表会話において，マルチモーダルな聞き手行動を利用
することによって，聞き手からの質問が出る前に，「どのような質問が出るか」
と「どちらの聞き手が質問するか」を推定できるかについて の分析を行った．
分析対象として，説明者が2人の聞き手に 対して30分 程度のポスター発表場面
を収録したコーパスを利用した．そこで行われた聞き手の質問を，「踏み込み
質問」と「確認質問」に分類した上で，その質問の発生元となる「先行セグメ
ント」とこの先行セグメントに含まれる説明者の発話，それらに対する聞き手
の相槌・うなずき・視線を特定した．その結果，「質問者は，踏み込み質問 の
先行セグメント中の説明者の発話に対して，確認質問の先行セグメント中の説
明者の発話に対してよりも有意に頻繁に相槌やうなずきを行う」，「踏み込み
質問を行う質問者は，非質問者と比べ，その質問の先行セグメント中の説明者
の発話に対して，有意に頻繁に相槌を行う」という知 見が得られた．

15. ジェスチャーの視点再考
◯東山英治，伝康晴 (千葉大)，坊農真弓 (情報研)，大塚和弘 (NTT基礎研)

我々は物語を語るとき、その物語にたいしてどのように関わっているかを表明
している。ジェスチャーでは話者が物語の空間に入り込んでその登場人物を演
じる登場人物視点と、その物語の空間からは引いて話者の目の前に登場人物を
配置するような観 察者視点の２つの視点がある。本研究ではこのような従来の
視点分類だけでは十分に捉え切れないジェスチャーの事例を紹介し、新たな分
類法を提案する。事例の１つは、ジェスチャーで演じている登場人物を身体の
中心に置くのではなく、他の登場人物の身体を中心に置くというものである。
これは、必ずしもジェスチャーで演じている登場人物の視点を、話者は用いる
わけではないことを示唆する。このようなジェスチャーで演じる登場人物と視
点の中心となる登場人物とのズレが、どのような語りをおこなっている時に生
じるのか、異なる語りの談話資料（話者の体験談の語りとアニメの説明課題の
語り）を比較し、事例を通して考察する。


16. 擬人化エージェントを用いた発話義務履行，発話権利行使による会話場の解釈 ---多人数の発話交替により現れる会話場の社会性の表現 －
◯湯浅将英，武川直樹，徳永弘子 (東京電機大)

本研究では、複数人会話の発話交替における聞き手の発話義務の履行や発話権
利の行使が、「社会的な適切さ」や「社会的な活性度」を示すものとして会話
参加者らに理解され、さらに会話参加者らがどのような会話をすべきか判断し
ていると考える。そして、擬人化エージェントの視線で発話義務や発話権利の
振る舞いを再現させた実験により、それらの社会性を会話者らが理解している
ことを示す。人は会話の発話交替において，発話義務や発話権利による「社会
的な適切さ」や「活性度」を観察し，会話場の雰囲気の良し悪しを評価してい
ると考える．発話義務や発話権利と場の社会性の関連を調べることで、複数人
会話における「場の雰囲気」が生成される仕組みを理解できる可能性がある。
擬人化エージェントによる発話交替シミュレーションを用いた検証により，人
が「複数人会話の場」を理解する仕組みを探り，さらにコンピュータによる多
様な対話の表現の実現を目指す．