YouTube・Netflix のおすすめはどう決まるのか — レコメンドシステム入門

読了 5分

YouTube を見ていると次の動画が自然に続き、Netflix を開くとトップ画面が自分の好みに合った作品で埋まっています。ショップでは「この商品と一緒に見られた商品」がそっと付いてきます。これらはすべて偶然ではありません。裏でレコメンドシステムが動いています。

今回の記事では、おすすめがどんな原理で決まるのかを、コードなしで解きほぐしていきます。おすすめが結局のところ何を計算しているのか、そしてそのおすすめがどうやってだんだん自分に合っていくのかを、非開発者の目線で見ていきます。

おすすめは、結局のところ似ているものを探すことです #

レコメンドシステムがやることは、ひとことで言えば似ているものを探すことです。方向は大きく二つあります。一つは自分と好みの似た人を見つけて、その人が好んだものを薦める方法、もう一つは自分がすでに好きなものと似たコンテンツを見つけて薦める方法です。

どちらも日常でいつもやっていることです。好みのよく合う友だちが薦める映画は一度信じて見てみますし、おもしろかった映画と同じ監督の作品なら手が伸びます。レコメンドシステムは、この二つの直感を、数えきれない人とコンテンツについて自動的に、大きな規模でやってのけるのです。

似た人をたどる方法 #

一つ目は、自分と好みが重なる人たちを手がかりにする方法です。よく協調フィルタリングと呼びます。自分と似たものを好んできた人たちが楽しんだもののうち、自分がまだ見ていないものを選んで薦める方式です。

「この商品を買った人はこんな商品も買っています」という見慣れた文句が、まさにこの方法です。コンテンツの中身を一つひとつ分析しなくても、人々の行動が重なるパターンだけで、かなりもっともらしいおすすめが出てきます。多くの人の選択が積み上がるほど、この方法は正確になります。

コンテンツそのものの似ぐあいをたどる方法 #

二つ目は、コンテンツそのものがどれだけ似ているかを見る方法です。映画ならジャンル、出演者、雰囲気といった特徴を見て、似た作品を薦めます。あるアクション映画を最後まで見たなら、似たジャンルや出演者の別のアクション映画を薦める、という具合です。

この方法には、人々の行動がまだ十分に積み上がっていない新しいコンテンツにも使えるという利点があります。公開されたばかりで誰も見ていない動画でも、特徴が似ていれば、ふさわしい人に薦められるからです。実際のサービスは、この二つの方法を混ぜて使います。

クリックと視聴が、おすすめを慣らしていきます #

レコメンドシステムは、一度決めたら終わりというものではありません。自分が何を押したか、どれくらい長く見たか、途中で消したかといった行動がふたたびデータとして積み上がり、そのデータが次のおすすめをさらに精密に整えます。使えば使うほど自分に合っていく気がするのは、このためです。

ここで先に扱った話がつながります。おすすめが賢くなるには、ユーザーの行動がイベントとしてきちんと記録され、指標として整理されている必要があります。レコメンドシステムは、そうして集まったデータを燃料にして回ります。

おすすめが、間違った方向に慣れていく場合もあります #

おすすめがいつも良いことばかりとは限りません。自分が見たものと似たものばかりを薦めつづけると、だんだん似た内容しか見なくなり、視野が狭くなることがあります。よくフィルターバブルと呼ばれる現象です。

また、人々が刺激の強いコンテンツに長くとどまる傾向があれば、その行動につられて、おすすめが刺激の強い方へ偏ることもあります。おすすめは人々の行動を映す鏡なので、行動に含まれた偏りまでそのまま追いかけます。だから多くのサービスは、あえて新しい種類のコンテンツを混ぜ込んで、バランスを取ろうとします。

なぜ非開発者が知っておくと仕事が楽になるのか #

  • おすすめを一歩引いて見られます。 トップ画面に出たものが客観的な正解ではなく、自分の行動を映した結果だと知っていれば、おすすめに引きずられずに選べます。
  • 企画に活かせます。 おすすめがデータを燃料にすると知っていれば、どんな行動を記録しておけばおすすめが良くなるのかを、前もって設計できます。
  • 限界を説明できます。 おすすめがなぜときどき一方に偏るのか、新しいコンテンツがなぜ薦められにくいのかを、同僚に落ち着いて説明できます。

まとめ #

今日は、YouTube や Netflix に代表されるレコメンドシステムが、似た人と似たコンテンツを手がかりにおすすめを作り、私たちの行動をふたたび燃料にして、だんだん精密になっていく流れを見てきました。おすすめは結局のところ似ているものを探すことであり、その材料は私たちが残した行動だ、という点が肝心です。

おすすめに使われる AI がどうやって学習するのか気になればAI、機械学習、LLM の全体像を、おすすめの燃料になるデータと指標がどう積み上がるのかをもっと知りたければサービスのデータとログはどう分析するのかを一緒に読んでみることをおすすめします。

X