人間の脳を模倣したSRIのソフトウェアがAIの「edge(エッジ)」を強化する

Car interior

SRIのNeuroEdgeフレームワークというエッジコンピューティングの新分野は、急増するAIのエネルギー消費を抑制する可能性があり、エッジコンピューティングの効率性と応答性のさらなる向上を目指す


人工知能(AI)の応用分野が急拡大する中、このテクノロジーが莫大な電力消費を必要とすることに対し、多くの専門家は懸念を示しています。さまざまな推計によると、世界のAIの電力需要はわずか2年以内にカリフォルニア州全体の発電容量に匹敵する水準に達し、2030年までには米国全体の電力需要の10%を超える可能性もあります

エネルギー使用量を大幅に削減しつつ、AIの性能を向上させる有望な方法として「エッジコンピューティング」が注目されています。その基本的な戦略は、電力消費が多いデータ処理を、データ生成やデータを必要とする場所に可能な範囲で物理的に近づけ、従来のデータ伝送や中央集約型処理にかかる電力を削減するということです。この「エッジ」ネットワークの例として、工場の現場や自動運転の自動車、小売店、スマートフォンなどに搭載されたアプリやセンサーなどがあげられます。

「NeuroEdgeは、急激に変化する環境内でもAIベースのシステムが効率的に作動し、リアルタイムで適応できるようにします」―David Zhang

持続可能なAIイノベーションを推進するにあたり、SRIは「SRI NeuroEdge」というこれまでにないコンピューティングプロジェクトを推進しています。このソフトウェアフレームワークのコンセプトは人間の脳の働きから着想を得ており、この「ニューロモルフィック: neuromorphic」な(人間の脳の働きを模倣する)アプローチをエッジコンピューティングに適用しています。このフレームワークについては、AIのデータ処理効率と電力消費性能を大幅に改善しつつ、性能を著しく損なうことがないことがすでに示されています。

SRIのCenter for Vision Technologies(ビジョンテクノロジーセンター)のVision Systems Labに所属するシニアテクニカルマネージャーのDavid Zhangは次のように述べています。「NeuroEdgeは、急激に変化する環境内でもAIベースのシステムが効率的に作動し、リアルタイムで適応できるようにします。現在使用されているマイクロプロセッサーやGPU(Graphic Processing Unit、グラフィック処理ユニット)と同等の機能を備えつつ、消費電力が低くて計算効率が高い小型デバイスへの需要は非常に高まっています。私たちは、NeuroEdgeに組み込んだ一連のテクノロジーでこのニーズに対応していきます」

NeuroEdgeの優位性

NeuroEdgeは2021年末に正式に始動しており、SRIの内部資金から、そして外部資金として米国政府の国防高等研究計画局(DARPA)およびインテリジェンス高等研究計画活動(IARPA:Intelligence Advanced Research Projects Activity)からの支援を受けています。これらの助成金は各特定の課題に対応するようにしなければなりませんが、ソフトウェアとハードウェアの進歩を促進し、中央集権的なクラウドコンピューティングリソースへの依存を軽減、もしくは不要にするという共通のテーマを有しています。

AIをセンサーデータに応用する研究の多くは現在、ある一つの根本的な課題に直面しています。意思決定に関与するセンサーデータは一部にすぎず、データの大部分は関与していません。そして、1バイトの余分なデータを処理するには、余分な時間と電力を費やす必要があります。では、関連するデータにのみ焦点を当て、より迅速に、かつコスト効率よく結果を得るには、ハードウェアとソフトウェアをどのように調整したらよいのでしょうか?

エッジAIの速度と効率を劇的に向上させる万能かつ唯一の解決策は存在しません。だからこそ、最も大きな違いを生じさせる介入を慎重に積み重ねていくことが重要です。NeuroEdgeはエッジコンピューティングを改善するにあたり、複数のアプローチを統合することで、これを達成しようとしています。そして、その多くはニューロモルフィックな性質を有しています。

NeuroEdgeに組み込まれているアプローチの一つとして、超次元コンピューティング(hyperdimensional computing)があげられます。従来の計算では、命令やデータを0と1で示す単純な二進数を使用していますが、超次元コンピューティングでは高次元のベクトルを用います。ベクトルとはデータを表す0と1の配列であり、画像の画素の密度や位置に例えることができます。「超次元」では、この配列の長さが数千ビットにもなり、一般的な3次元座標平面のx、y、z次元だけでは表現できません。この配列は冗長ですが「ノイズ」に耐性があることから、エラーに対して頑強であり、情報がこの中で分散していても計算効率が高いという特徴を備えています。人間の脳は、これと同じように超次元モードで情報を表していることが判明しており、データ属性を正確に記述するにあたり、標準的な低次元のコンピューティングより効果的ではないかと考えられています。

この超次元コンピューティングの手法は、NeuroEdgeの主要な機能の一つである「ドメイン適応」に寄与しています。このソフトウェアは、AIモデルのトレーニングに使うデータセットに未収用であるオブジェクトの検出と収集に焦点を当てるよう、構成されています。そして、NeuroEdgeはこのような新しいアイテムに対応するにあたり、メモリや計算、エネルギーの面でコストがかかるような、エッジから離れた場所でモデル全体を再トレーニングするのではなく、「アダプター」をモデルに追加することができます。そして、このアダプターはネットワークの総用量のほんの一部を使用するだけなのです。そうすると、再トレーニングが必要なのは、これらの小さなアダプターだけになります。そして、モデルの大元は保持されていることから、NeuroEdgeは既知のことを「忘れない」のです。ちなみに、「忘れてしまう」というのは、現在のAIモデルでよく見られる問題です。よって、NeuroEdgeは環境の変化に応じて適応し続け、生物の脳が素早く柔軟に処理している新しい知識の取り込み(Zhangとその共同研究者はこれを「継続的学習」と呼んでいます)に似た機能を実現しています。

つまり、NeuroEdgeの特徴は、標準的なAIエッジシステム構成と比較して100倍、あるいは1,000倍も効率的なプロセスを実現するということです。

NeuroEdgeのニューロモルフィックな特徴としてもう一つあげられるのは、インピクセル処理(ピクセル内処理:in-pixel processing)です。つまり、デバイス内の他の部分や遠隔地のサーバーファームで処理を行うのではなく、カメラに配列されているピクセル(画素)内でデータ処理を直接行います。人間の視覚システムにおける「初期視覚」では、このインピクセル処理を実施しています。網膜と脳領域の「下位」(主に視床)は、光の光子一つ一つから得られる信号を脳の認知領域に洪水のように送り込むのではなく、まず初めに私たちが見るものをフィルタリングして分類・処理しています。「私たちの目は脳に生の信号を脳に送っているわけではありません。私たちの脳は、それでは処理できないのです」とZhangは述べています。

NeuroEdgeは同じように、フロントエンド処理を行ってから、データをより高度なバックエンド処理に送信します。フロントエンドでは、冗長な処理を回避するという脳の戦略、いわゆる「サッケードメカニズム:saccadic mechanism」を採用しています。人間が何かを見るとき、目は眼窩内で素早く動いて、すでに視覚記憶に保持・分類されているものの大半には気を留めず、その場面の新しい情報に焦点を合わせます。

NeuroEdgeが採用しているこのサッケードメカニズムでは、最初に最も興味を惹かれる領域を選択するときに、ピクセルの間に組み込んだAIコンポーネントを使用します。例えば、自動運転の自動車の場合、注目すべき対象は他の車両や歩行者であり、空の雲や街路樹ではありません。NeuroEdgeが組み込まれているデバイスは、視覚領域の全体を何度も処理するのではなく、注目領域からシーンを動的に構築して効率的に処理します。その結果、センサーからバックエンドへのデータ送信帯域幅と処理実行時間が10倍も削減できるのです。

最後になりましたが、NeuroEdgeのエッジ性能向上に関する重要なコンセプトは、複数のデバイスがエッジで個別に学習した内容を共有する、革新的な「ヘテロジニアス・フェデレーテッド・ラーニング(heterogeneous federated learning、異質フェデレーション学習)」の活用です。このローカルで実施する計算メソッドは、全センサーデータをセントラルサーバーに送信するよりはるかに効率的ですが、各デバイスが収集するデータセットに大きなばらつきがあることや、ハードウェアの能力が均一ではないといった課題に対応する必要があります。NeuroEdgeはこれに対して、各デバイスで実行・更新されるAIモデルを、利用可能なリソースに合わせて調整し、再びローカルのアダプターに依存させるという仕組みを採用しています。
つまり、NeuroEdgeの特徴は、標準的なAIエッジシステム構成と比較して100倍、あるいは1,000倍も効率的なプロセスを実現するということなのです。

まもなく、あなたの近くのエッジにやって来る

NeuroEdgeが成熟するにつれ、早期に採用したいという企業から問い合わせがすでに寄せられており、SRIは様々な機会を模索しています。エッジアプリケーションは、国家防衛から輸送、物流、そして一般的な電化製品など、幅広い分野に活用できます。
NeuroEdgeがこれらの全分野にわたって適用が可能である理由の一つは、処理するセンサーデータの種類に全く依存しないということです。入力データは、カメラやハイパースペクトラルイメージャー、ラマン分光計、圧力センサー、マイク、もしくは他の物と、多様なソースから取得されると思われます。これに対し、政府系の資金提供機関は、他の政府関連のコントラクターが開発した伝統的ではないハードウェアデバイス(例えば光子回路など)に関する、唯一のソフトウェア開発者としてNeuroEdgeを選定したことを見れば、NeuroEdgeに広範な有用性が備わっていることがわかるのではないでしょうか。

Zhangは次のように述べています。「現在の進捗とNeuroEdgeが生み出している興味について、私たちは大変うれしく思っています。エッジコンピューティングは、現在のコンピューティング能力の最先端に位置しており、大きな進歩をもたらす可能性を秘めています。私たちはそのソリューションの一端を担えることを楽しみにしています」

SRIがAIの未来をどのように描いているかについて、詳細はこちらまでお問い合わせください。

この研究は、一部米国政府の資金提供を受けています。本ブログに含まれる見解および結論は著者のものであり、明示的または黙示的を問わず、米国政府の公式政策を代表するものではありません。

本研究は、Office of the Director of National Intelligence(ODNI)、Intelligence Advanced Research Projects Activity(IARPA)(2022-21100600001)の一部支援を受けた研究に基づいています。本ブログに含まれる見解および結論は著者のものであり、ODNI、IARPA、または米国政府の公式政策(明示的または黙示的を問わず)を必ずしも代表するものと解釈されるべきではありません。米国政府は、著作権表示の有無にかかわらず、政府目的のために複製および再配布する権限を有します。


Read more from SRI