
子どもたちはオンライン動画を大量に視聴している。SRIは、機械学習を活用して、スクリーンタイムを学習成果の高いものにする方法を模索している
2020年に実施された大規模調査では、米国の保護者の80%が「子どもがYouTubeを見ている」と回答しました。そしてその後の2024年の調査では、子どもの30%が1日2時間超YouTubeとYouTube Shortsを視聴していることが判明しました。
そのコンテンツのうち、なんらか有意義な教育的効果があるものはどのくらいあるのでしょうか?そして、子どもたちはそこから何を学んでいるのでしょうか?これは極めて重要なことなのですが、これまで答えられてこなかった疑問です。SRIの研究者たちはこの難問を解き明かそうと、機械学習に目を向けています。
SRIのAPPROVE(Assisting Parents to Review Online Videos for Education、意訳:教育用オンライン動画に対する保護者への支援)プロジェクトでは、AIを活用したアプリを開発しています。このアプリは、保護者や教師がメディアを健全に活用する一助となるとともに、オンライン動画が子どもたちに与える影響についての知見を深めることを目的としています。
膨大なコンテンツの大海をどのように分類すればよいのか
SRIのシニア教育研究員であるClaire Christensenは、子ども向けのオンラインメディア研究における難しい課題の1つとして、コンテンツが膨大な量で存在することをあげています。YouTubeが発表している統計によると、1日平均2000万本の動画がユーザーによってアップロードされています。この大きな規模では、人間が動画を見て内容にコードを付与する(ラベリングする)という手動での分類は不可能です。そこで、APPROVEの研究チームは、その代わりとなるようなAIツールを開発しました。
「私たちの目標は、幼い子どもたちが質の高い教育的なメディアに触れる機会を増やすことと、このデジタル時代の中で学習を支援できるようなより良いツールを保護者や教育に携わる人たちに提供することです」―Claire Christensen
APPROVEは、動画内にある幼児向けの文字と算数関連のコンテンツ、ならびに指導の質を自動検出する機械学習モデルです。APPROVEは、学習基準である州のコモンコアスタンダード(Common Core State Standards、各州共通基礎スタンダード)と0歳から5歳までの教育に関する枠組みのHead Start Early Learning Outcomes Framework(ヘッドスタート早期学習成果フレームワーク)に則って、就学前(4歳以下)および義務教育初年であるキンダー(5歳)レベルの算数と文字に関するコンテンツを抽出します。そして、動画がこれらのテーマをどのように教えているのか、つまり、指導の質についても検知します。例えば、動画で質問を投げかけていて、それに対する子どもたちの応答を待っているかどうか、そして、キャラクターやストーリーを用いて教えているか、などです。
このモデルは、子ども向けメディア研究者や幼児学習の研究者、そして機械学習の専門家で構成される学際的なチームが開発しており、人間がラベリングした動画のデータセット約1200本で訓練したこのモデルは、マルチモーダルコンテンツ検出を活用して動画内の音声と視覚の信号を処理します。
米国国立科学財団(National Science Foundation)の資金提供を受けた研究を基にした査読済みの新しい論文では、APPROVEモデルの性能に関する有望な初期データをいくつか提示しています。その一部をあげると、このモデルは幼児期の算数に関するコンテンツを92%の精度で検出でき、指導の質を示す指標は最高95%の精度で検出できました。
この研究の次段階では、展開のはやいコンテンツと説得的デザインを取り上げる
このチームはまた、動画が説得的デザイン(Persuasive Design)であるという指標を検知できるようAPPROVEの開発を進めています。ここでいう「説得的デザイン」とは、展開が早いことや色彩が鮮やかであること、そして音響効果など、子どもの興味を引きつけることを意図した制作上の要素を指します。APPROVEチームが特に注目している領域の1つが、展開がはやいコンテンツです。過去に行われた複数の研究では、8歳以下の子どもにおける「展開がはやい動画の視聴」と、「実行機能や注意力の低下などのネガティブな結果」との関連性が示されています。幸いなことに、APPROVEチームは時系列機械学習モデルが展開のはやいコンテンツを85%の精度で検出可能であると新しい白書で述べています。このモデルは、従来のように人手にてラベリングを実施するよりも、時間と労力を節約できるのではないかという可能性を秘めています。
「私たちの目標は、この研究を拡大し、願望充足テーマや鮮やかな色彩、大きな音響効果、強烈な感情など、展開のスピード以外の説得的デザインに関する要素を検知できるようになること、そしてこれらの要素を発達の結果と関連付けることです。そしてより長期的な目標は、これらのモデルを縦断的研究に統合し、子どものメディア利用とそれが注意力、実行機能、不適切なメディア利用に与える影響を追跡することです」とChristensenは述べています
研究室から家庭や教室へ
子どもたちと保護者、そして教師がオンライン動画の大海を進んでいくにあたり、その一助となるには、発達の成果として形成される要素を具体的に特定し、その理解を深めることが極めて重要です。このAPPROVEプロジェクトがこれらの要素を大規模に検出できるということは既に実証されており、子どもたちが実際に視聴したより広範囲かつ多様な動画のデータセットを使って、研究者たちがこのモデルを訓練すれば、その精度は今後も向上し続けるでしょう。このチームはまた、APPROVEモデルを適応させ、理科など他の教科や、異なる年齢層・学年の教育基準に沿ったコンテンツを検出できるようにしようとしています。
今後については、保護者や教師が子ども向けの教育的メディアを厳選する際に役だつような、使いやすいアプリケーションにすることもAPPROVEのビジョンに含まれています。保護者が教育的なコンテンツであることを基に、推奨される動画をフィルタリングしたり(学習を強化できるようなAI生成の会話プロンプトも使用できる)、教師がAPPROVEを使って指導に最適なメディアを探す時間を削減したりできることが想定されるのです。
「突き詰めると、私たちの目標は幼い子どもたちが質の高い教育的なメディアに触れる機会を増やし、デジタル時代における学習を支援できるような優れたツールを保護者や教育者に提供することです」とChristensenは結論づけました。
SRIのデジタル学習やテクノロジープログラムについて、詳しくはこちらをご覧ください。

