本研究は、大規模言語モデル(LLM)を活用した「人狼知能」エージェントの開発とその言語的相互作用の分析を目的としています。従来の記号的(プロトコル)な通信による人狼知能とは異なり、自然言語を用いた対話を通じて、エージェント間でどのように説得・信用の獲得・騙し合いが行われるかを解明することがメインテーマです。
不完全情報ゲームである人狼において、他者の発言の意図を正確に解釈し、自らの戦略を自然言語に乗せて他者を誘導する能力は、人間とAI、あるいはAI同士の高度なコミュニケーションを評価するための重要な指標となります。
高度な盤面推論と自然な対話生成を両立させるため、以下のアーキテクチャを採用してシステムを実装しています。
生成された対戦ログを分析し、盤面の状況(序盤の不確定な局面、終盤の勝敗に直結する局面)や、相手の反応に応じて、最も効果的な説得パターンを動的に選択して発話する「説得・信頼構築アルゴリズム」をエージェントに実装する。また、他者からの根拠なき説得を検知して同調を防ぐ防衛ロジックの有効性を検証する。
今後の具体的な目標は以下の通りです。