研究内容

人とロボットのインタラクション:対話ロボット

ロボットを複数台にするとユーザは楽になるか?

対話ロボットやスマートスピーカーなど、人と対話をする機械を目にする機会が増えています。 ですが、まだまだ人間と同じように相手の意図を汲んで文脈に合わせたスムーズな対話を実現するところまでには至っていません。 対話システムの性能だけでなく、音声認識のミスや文脈理解の不足などにより、ユーザの意図とずれた返答をすることで対話が破綻することはまだまだ多くあります。 こうした問題への対応策として対話ロボットを複数台にすることで2台めがフォローする対話戦略があります。しかも1台のときと比べてユーザは楽に話すことができることもわかっています。

発話ミスによる対話破綻を2台目がフォローできるか?

2台目のロボットがどのようにフォローすることができるでしょうか。1台目の応答が外したとき、2台めが「元のユーザ発話に対して」正しい応答をすればもちろん良いフォローになります。 ユーザは直前のミスを忘れて新しい応答で記憶を上書きしてくれます。ですが、もし2台めが正しい応答ができるのなら1台目がやれば良いのですからこれは現実的な作戦ではありません。 では2台めが「1台目の発話に対して」正しい応答をするとどうでしょう。ロボット同士ですからこれは(裏で通じていれば)可能です。なんとこの場合もフォローになりました。 ユーザは1台目と2台目のスムーズな流れになんとなく流されて、自分の発話と1台目の応答のズレからくる違和感が軽減されてしまうことがわかりました。

直接フォローできれば効果的だが難しい
スルーして繋げてもなんとなく流されてくれる
 

人と人のインタラクション:グループディスカッション

人と人の対話では、言語以外に非言語情報が重要な役割を果たしています。就職活動でもよく利用されるグループディスカションの場面を例に、対話時の人の発話と動作を計測して何が評価の要因になるか、顔向きや動作などの非言語情報の効果はどのように現れるかなどを研究しています。

モーションキャプチャによる動作計測
グループディスカッションの書き起こしとセンサデータ

人狼知能:「人狼ゲーム」を戦う人工知能

囲碁や将棋などの完全情報ゲームでは、人類最強のプレイヤーも人工知能には勝てない時代になってきました。しかし、プレイヤーが情報を隠したり騙したりするゲームについてはまだまだ研究の余地があります。

様々なパラメータで作成したエージェントのうち、どれが最も強いのか。対戦相手や役職の割り振りに影響されない、偏りの少ない「強さ」の評価方法に重点的に取り組みました。この戦略を元に参戦した 人狼知能世界大会(IJCAI2020/ANAC2020)プロトコル部門で丸山(M2)、八田(B4)のチームがファイナルに進出し、 惜しくも入賞はなりませんでしたが5位に食い込みました。引き続き、偏りのない強さ評価、特に局面記述のパラメータ重要度の評価に取り組むとともに、自然言語部門への参加を目指して研究を続けています。
[追記]2021年度、IJCAI2021コンペティショントラックで開催された第3回人狼知能世界大会では、前年同様に「正しい強さ評価重視」の戦略で八田(M1)、高橋(B4)、古川(B4)のチームが参加。プロトコル部門の3位と6位に入りました。 大学の公式ページでの紹介から。 人狼知能国際大会で決勝戦進出(大学広報) 来年度は自然言語部門への参加と上位入賞が目標です。
大学の広報note[2022/02/03]で取り上げてくれました。 Action! #12 AIは嘘つき狼 人狼知能の挑戦 八田君、w高橋君、古川君がインタビューに答えています。

偏りのない強さ評価を行う
PowerPlayの有効場面を統計的評価

「ロボットは東大に入れるか」人工知能は入試問題を解けるか?

2011年に10年後の東大入試合格を目指して「ロボットは東大に入れるか」プロジェクトがNIIの主導で始まりました。2016年にNIIのファンドは終了しましたが、引き続き各機関がいくつかの科目への挑戦を継続しています。

センター試験英語(筆記)については、NTTと複数の大学により2019年に200点満点中の 185点を達成し、 マークシート多肢選択型ながら東大合格ラインまで到達しました。しかし、リスニング問題ではまだ十分な成績があげられていません。特に選択肢がイラストで与えられているタイプの問題については、 イラストの意味を毒解するという機械にとっては非常に難しい課題があり、引き続き取り組んでいます。

trobo
東ロボプロジェクト2018年時点のまとめ本(第1章英語を分担執筆)。卒研生も5人貢献しました。