Avsr AIの挑戦:ロボットに自律性と器用さを教える

Robot hand and human hand

SRI発のスタートアップ、SRIの技術を駆使して、より器用で柔軟な未来の協働ロボットの開発へ


「ロボットは、AIの最も高度な形での具体化です。かつて二次元の画面の中に留まっていたAIが、三次元の現実空間で動き出す―その姿こそロボットです」そう語るのはAvsr AIの創業者であるVikrant Tomar氏です。Avsr AIとは、SRIのベンチャー部門から創業支援を受け、最近SRIからスピンアウトしたロボティクス・スタートアップであり、Tomar氏はロボット知能の未来を切り開こうとしています。

AIのロボティクスへの応用は、長い間科学者たちの関心の的でした。SRIは、1960年代後半には、人工知能によって自ら周囲の状況を判断して動く世界初のAIロボット「Shakey(シェーキー)」の開発に成功しています。近年、生成AI(GenAI))モデルの登場により、ロボティクスの戦略と手法に強力なツールが新たに加わりました。「生成AIの影響はチャットボットに留まりません。その最大の影響の1つは、多段階・長期的推論、つまり、何段階もの手順を考えて、先の先まで見通しながら判断する能力です。この能力は自律型ロボット実現のために欠かせない要素なのです」とTomar氏は指摘します。

複雑で変化の激しい現実の世界でロボットをもっと便利なものにしていくために、研究者たちは3つの根本的な課題を乗り越えなければなりません。その課題とは、知覚、理解、そして正確・柔軟な動作です。つまり、ロボットは、周りの状況を把握し、任務遂行のための段取りを考え、理詰めで判断し、さらには、さまざまな形や大きさ、硬さの物に応じて反応しながら、それを適切に扱えなくてはなりません。「本当に難しいのは、この3つの課題を同時に解決できる総合的な枠組みを作ることです。賢く判断できるロボットの頭脳を作るだけでは足りません。その判断を現実の動きに落とし込み、扱いの難しい物体であっても、人間に近い繊細さと制御力とで、リアルタイムで器用に動かせる実行システムを構築することが求められているのです」とTomar氏は語ります。

Avsr AIが生まれるまで

Tomar氏がAIへの道に進んだのはインドでした。その後、カナダのMcGill Universityに渡り、音声と言語理解をテーマに、深層学習とAIの博士号取得を目指しました。

Tomar氏は、まだ初期段階であっても成長著しいモントリオールのスタートアップ界隈に飛び込みます。彼はまず音声技術に特化したNuanceで10カ月間働きました。NuanceはSiriの開発グループから生まれた、SRI発のスピンアウト企業です。音声認識のための深層学習とニューラルネットワークの可能性が本格的に開花し始める中、Tomar氏は成長著しいAI分野の追い風を受けて、Fluent.aiを設立します。同社は、あらゆる言語やアクセントに対応し、オフラインで動作し、ノイズに強いという画期的な音声認識技術を開発しています。Tomar氏は事業を進める中で、Xperi(TiVoの親会社)、Arm、Boschといった企業との商業パートナーシップを結ぶことに成功しました。

Avsr(自律性と汎用性とを備えた社会的ロボット技術を意味するAutonomous versatile social roboticsを表す)には、AIとロボティクスのベテラン技術者たちが集結していて、Fluent.ai時代の同僚たちもメンバーに加わりました。さらに、SRIからのライセンスにより導入された画期的なAIとロボティクスの技術は、Avsrが次世代ロボティクス分野に大きく羽ばたくための原動力となります。SRIとの提携により、AI分野に豊富な知見を持つ創業メンバーは、SRIの知的財産を活用した新たな開発に踏み出すことができるのです。SRIが提供する代表的な技術には、遠隔操作とテレプレゼンスに対応したプラットフォームである「XRGo」、低計算コストで空間知能を実現する画期的な「Dexterous Manipulation」、さらに、SRIの情報・計算科学部門(Information and Computing Sciences division)にあるビジョン技術センター(Center for Vision Technologies)で開発された、生成AIを活用したロボティクス計画技術「SUWAC」などがあります。

リアルなデータで育てるリアルなロボット

Avsr AIの技術は複雑ですが、目指していることはシンプルです。それは、ロボットを現実の環境に安全に導入し、実際の運用を通じて得られたデータをもとにロボットを支えるAIモデルを微調整しながら、できるだけ早く投資に見合う成果を出せるレベルに引き上げることです。

自動運転車は、周囲の状況をリアルタイムで把握しながら走行するインテリジェントマシンの代表格です。自動運転技術をここまで進化させるには、膨大な運転データの蓄積が必要でした。しかし、より広いロボティクス全体の中で見ると、「運転」という行為は比較的シンプルです。なぜなら、自動運転と環境との関わりは、基本的には平面上で完結する二次元的なものだからです。それに比べると、三次元空間での移動や物体の操作をロボットに自律的に行わせることは、ずっと複雑な課題です。つまり、より多くのデータが必要になるだけでなく、そのデータの内容も格段に細かく精緻でなければなりません。ロボットにはさまざまの用途があり得ますが、その多くの分野について、そうしたデータはそもそも存在していません。そして、わずかに存在するデータも、たいていは現実の環境ではなく、シミュレーション環境で行われたロボットの訓練によって得られたものなのです。

「研究施設や開発用の実験スペースで現実世界を再現することでも、有益なトレーニングデータは得られます」とTomar氏も認めます。ただし、そうしたシミュレーションには相応の限界もあるのです。シミュレーション環境だけで訓練されたモデルは、たいていの場合、実際の環境に導入した際にうまく機能せず、最先端の研究機関でさえ、一般的なタスクにおける成功率は50%未満に留まっています。AR環境や人間の動作を記録した映像をもとに学習するといった別のアプローチもありますが、これらはまだ初期の研究段階に留まっています。現在最も有効とされているのは、実環境で収集したデータと、実環境下での素早い調整・適応とを組み合わせる方法です。現時点では、「シミュレーションから現実へのギャップ(sim-to-real gap)」を効果的に埋めるためには、シミュレーションベースの学習を、実環境でのデータと調整の仕組みとで補うことが不可欠です。

「私たちは、ロボットとの協働が大きな改善を生み、それを定量的に示せる領域に注力しています」―Vikrant Tomar

Avsr AIのチームは、手間をかけずに高精度な実環境データを収集する手法の開発を進める一方で、必要なデータ量を徐々に抑えながらも高い効果を維持できる学習手法の研究も進めています。もちろん、実環境のデータは不可欠ですが、その収集にかかる手間を減らし、最終的には、有効な学習に必要なデータ量自体を抑えることで、柔軟に拡張可能な、費用対効果の高いロボティクス・ソリューションを可能にします。この目標に向けて、Avsr AIのチームは、強化学習とSRIの優れたXRGoシステムとを統合したフレームワークを開発しました。これにより、スムーズなデータ収集と、精緻な動作スキルの迅速な習得が可能になっています。

Avsr AIにとって投資回収を早める鍵は、ロボットをできるだけ早く現場に投入し、ラボでは再現しづらい限界的なケースも含めた最適な実環境データを蓄積することにあります。Tomar氏はこの戦略を、「実環境への早期投入」という意味で「early-to-world」アプローチと表現しています。つまり、安全かつ管理された形で、できるだけ早く実際の職場環境にロボットを導入することを意味します。重要なのは、目指しているのは、わずかな人数の人間の介入だけで状況に応じて素早く適応しつつ、しかも高いパフォーマンスを維持できる、機能的かつ汎用性の高いロボットの開発なのです。

ロボットの次なる進化の舞台は?

多くの業界がロボティクスの将来に注目しています。製造業では、長年の人手不足のロボットによる解消が期待されています。そして、エネルギー、鉱業、化学といった業界では、人間にとって危険な現場環境でも作業を進められるロボットに大きな関心が寄せられています。また小売業では、棚の補充コストを最適化し、価格表示や陳列のミスを24時間態勢で修正できるロボットプラットフォームが有望視されています。

ロボットが活躍できる領域は非常に広いと考えているTomar氏ですが、あらゆる分野に対応できるわけではないとも認めています。Tomar氏はこう語ります。「私たちは、ロボットとの協働が大きな改善を生み、それを定量的に示せる領域に注力しています。たとえば、人手不足の解消や、危険な現場における安全性の向上といった課題がある分野です。そこで私たちが注目しているのは、こうした市場の関係者が、ロボットの助力や自動化を、どれほど積極的に受け入れようとしているのだろうか、という点です」そんな問いに対し、自律的で器用なロボットの導入によって関係者全員がメリットを得られる良い例として、Tomar氏が挙げるのが製造業や物流の現場です。「これらの領域は、ロボットとの協働にうってつけの状況にあります。生産性の向上や安全性の確保といった面で、ビジネスオーナーから現場の労働者、そして消費者に至るまで、全ての関係者にとって非常に大きなメリットが期待できるのです」とTomar氏。そして、宇宙探査もまた、自律的で精緻な動作能力と高度な物体操作技術とを備えたロボットがとりわけ強みを発揮できる分野だと指摘します。人間にとって過酷な環境である宇宙では、こうしたロボットの優位性が特に際立ちます。

Tomar氏は、どのような用途であっても、ロボットをできるだけ早く現場に導入し、安全に実験を重ねることで成果は確実に向上すると見ています。

Avsr AIやSRIのベンチャー部門について詳しく知りたい方は、こちらからお問い合わせください。


Read more from SRI