AI翻訳技術の次なる展望は?

Young woman on a bus conversing on a phone with earbuds

Apple AirPods Pro 3 のレビューにおいて、ニューヨーク・タイムズは 翻訳技術の進化とそのビジネス的意義を探るため、SRI の音声技術専門家Dimitra Vergyriに見解を求めた


Apple AirPods Pro 3 の登場により、翻訳技術は一躍注目を浴びています。Apple によると、この新製品は「AirPods を使って自然に話すことで、ユーザーが他の言語を理解し、他者とコミュニケーションできるようにする」とのことです。AirPods Pro 3 は、英語、フランス語、ドイツ語、ポルトガル語、スペイン語の翻訳機能を搭載して発売され、続いてイタリア語、日本語、韓国語、中国語(簡体字)をはじめ、今後も新しい言語に対応・追加していく予定です。

ニューヨーク・タイムズの消費者向けテクノロジー担当主任記者(consumer technology writer)Brian X. Chen氏が AirPods Pro 3 をレビューするにあたり、SRI のDimitra Vergyriにこの新たな進歩の意義や重要性について解説を依頼しました。(SRI の音声技術担当ディレクターであるVergyriは、Apple に音声処理技術における初期の優位性をもたらした、SRI 発のプラットフォーム “Siri” を生み出した研究の流れを継承しています。)

Vergyriはニューヨーク・タイムズに対して、AirPods は従来の翻訳技術ではなく大規模言語モデルを採用しているため、過去の手法と比べて翻訳の精度が向上すると語りました。これは主に、言葉(単語)は文脈に基づいて意味を持つため、大規模言語モデルは会話全体を踏まえて単語を翻訳する能力に優れているからです。彼女は、従来の技術に内在する誤りは、より大きな文脈を考慮に入れない断片的な文単位のアプローチに起因することが多かったと指摘しました。

同時にVergyriは、大規模言語モデルが必ずしも完全な文脈の理解を保証するわけではないと注意を促しました。例えば、感情や文化的なニュアンスは非常に複雑になり得るからです。

「真のコミュニケーションにおいては、依然としてギャップが存在します」とVergyriはニューヨーク・タイムズに語りました。

AI を活用した音声解析をメンタルヘルスのスクリーニングに応用する最近の研究など、SRI の音声技術に関する取り組みの詳細については、SRI の Speech Technology and Research Lab をご覧いただくか、こちらからお問い合わせください。


Read more from SRI