
人間と機械が協働する未来を描くため、SRIは真に協働できるパートナーとして機能するよう設計されたAIベースのシステムを構築
2023年、人工知能(AI)の応用は産業や職種を問わず、かつてないほど拡大しました。同時に、SRIの研究員であるMelinda Gervasioと同僚たちは根本的な限界に気付き始めていました。生成AI(GenAI: Generative AI)と大規模言語モデル(LLMs: Large Language Models)の登場によって、人間と機械の協働はこれまでになく深まっていましたが、その大半は行ったり来たりの単純なやり取りに過ぎませんでした。つまり、人間がタスクを指定してAIがそれを遂行しますが、これは真のチームワークとは思えなかったのです。
SRIの人工知能センター(Artificial Intelligence Center)のテクニカルディレクターであるGervasioがAIを協働の相手(協働者)として描く究極のビジョンは、テキストベースのチャットボットと交わすような面倒なやり取りではありません。AIが真の協働者になれば、人間の同僚のようにワークフローを進めていけるでしょう。そうしたAIは、厳格な「ターンベース」ではなく、文脈の中にある手がかりを理解します。そうすれば、単なるおしゃべりではなく、人間と共同でタスクを遂行することができます。優秀なチームメイトのように、思いがけない疑問を投げかけ、驚くような選択肢を提示してくれることさえあるでしょう。最終的には、既定の計画を単に実行するのみならず、計画プロセスそのもの、さらに人間の協働者のパフォーマンスをも向上させてくれるのです。
このようなAIベースのチームメイトを実現させるため、SRIのロボティクスラボとスピーチ・テクノロジー・アンド・リサーチ (STAR: Speech, Technology, and Research) ラボに所属するGervasioとその同僚たちは、COLLEAGUE(COLlaborative Language-Enabled Agents Grounded in Understanding and Explanation:理解と説明に基づく協働言語対応エージェント)プロジェクトを立ち上げました。目的は、人間と機械による協働の新たな枠組みを作ることです。そして、このプロジェクトは、SRI社内の研究開発資金を投入してスピードアップしたことで鍵となる概念実証をすでに打ち立てており、今年の後半には進捗状況をすべて定量化することを目指しています。「AIをベースにした自律エージェントを、目標や計画とともに決定し、作業を調整し、要求に応え、自然言語で積極的にコミュニケーションが取れる、人間と同じような真のチームメイトへと進化させたいと思っています」とGervasioは述べています。
「COLLEAGUE」は、人間と機械の協働をどのように改善するのか
COLLEAGUEは、人間とAIエージェントが共通の目標に向けて力を合わせる場面に焦点を当てています。Gervasioによると、これが成功するには、AIエージェントについて根本的に新しい考え方が必要です。また、エージェント型のアーキテクチャの大半は現在、単純なワークフロー内で作動するか、創発的協調(emergent coordination)に依存するコンポーネント(LLMベースのエージェント)であるとGervasioはみています。これに対し、COLLEAGUEはさまざまなAIエージェントとソフトウェアツール間の相互作用を計画的に管理するアプローチを採用しています。例をあげると、COLLEAGUEではコラボレーションマネージャーが各種のコミュニケーションエージェントやアクションエージェントをいつ呼び出すかを決定して、ステータスアップデートの実施や説明の要求、計画作成、実行監視などを行います。
「人間同士のやり取りと比べた結果、差がないことが人間とAIの協働における究極の目標です」 ― Melinda Gervasio
COLLEAGUEは「プロソディ(韻律)を意識した自然言語理解」も重視しており、ピッチや音量、間といった人間の話し言葉の音響や韻律の特徴も大いに考慮します。話されている内容よりも、どのように話されているかということの方がタスクの緊急性について重要な手がかりが含まれていることが多いのです。プロソディを意識した対話型AIとLLMを組み合わせることで、AIエージェントチームは発した言葉の裏にある「人間の意図」をより正確に推測できるようになります。
COLLEAGUEの枠組みの特徴としては、この他にも記憶の管理・検索が柔軟に行えること、および「心の理論(Theory of Mind)」に焦点を当てていることがあげられます。この理論によって、人間の観察では分からないような、相手の精神状態や信念に関するよりしっかりした洞察を機械に与えることができます。こうした枠組みのそれぞれの機能は、変動する環境の中で、問題を解決するとき、繰り返し困難に直面するとき、また協力して解決策を実行するとき、人間の発話と精神の動きが実際はどのように作用しているのかをAIの知能が正しく把握することを目指しています。
AIの同僚は、今後何ができるようになるのか
Gervasioは次のように述べています。「人間と機械がチームを組むことは、今後、防衛関連研究の重要なテーマとなるでしょう。私たちの安全を確保するため、AIを組み込んだサイバーフィジカルシステムと兵士の連携方法を継続的に改善するうえで、SRIは有利な立場にいます。また、COLLEAGUEのようなプロジェクトは、商用アプリケーションにおいても応用性が高いです。例えば、ファイザーは現在、自社研究所内でSRIのXRGo遠隔操作ロボットシステムの試験を実施しています。しかし、もしバイオサイエンス企業で人間が多数の自律型実験ロボットと全くシームレスに協働する段階に至ったらどうなるのでしょうか。このような可能性こそが、この研究領域を非常に興味深いものにしているのです」。
Gervasioとそのチームは、COLLEAGUEシステムの性能評価手法を複数提案しています。ロボットとの協働であれ、人間同士の協働であれ、共同作業に対する人間の反応には必ず主観が伴うため、これは容易なことではありません。まず初めに、個々のシステム構成要素の性能を検証することにしています。「例えば、計画に対するアプローチでは、私たちが立てた計画およびハイブリッドで計画したものを、純粋なLLMベースや純粋な自動計画のアプローチで立てたものと比較できます」
次の段階として、システムを構成する各要素を基準となるシステムと順次置き換えていき、それぞれの動作がシステム全体の性能にどう影響するかを見ることで、構成要素の評価をする予定であるとGervasioは説明しています。
このチームは現在、実験室内の環境で人間の技術者と協力して実験手順を開発・実施するハードウェアロボットパートナー「COLLEAGUE」を開発しています。
そしてより重要なのは、AIシステムと一緒に現実世界の問題を解決しようとする人間の様子を観察する試験です。「成功する頻度はどのくらいか、成功までにどのくらいの時間がかかるかということです。また、タスクの能力に関する数値だけでなく、協働の質についても測定したいと思っています。自然なコミュニケーションが取れているか、共通の意図は形成できているか、協調した行動ができているかについてです。タスクの成功を測定するのは比較的容易で、ユーザビリティや使い勝手を評価する標準的な調査手法も存在しています。しかし人間と機械の協働に関して、有用かつ実用的な数値指標を考案することは課題として残っています」とGervasioは述べています。人間と機械の協働に対するCOLLEAGUEのアプローチの質を検証するため、このチームは現在、実験室内の環境で人間の技術者や専門家と協力して実験手順を開発・実施するハードウェアロボットパートナー「COLLEAGUE」を開発しています。
そして最後に、究極の試験があります。「人間同士のインタラクション(やり取り)と比べた結果は」とGervasioは問いかけます。「これが人間とAIの協働における究極の目標です。人間とAIエージェントのパートナーシップが可能になり、人間がAIの能力を最大限に活用できれば人間同士の最高のチームワークと差はないと感じられるようになるでしょう」


