유튜브,넷플릭스 추천은 어떻게 정해질까? 추천 시스템 입문

4 분 소요

유튜브를 보다 보면 다음 영상이 자연스럽게 이어지고, 넷플릭스를 켜면 첫 화면이 내 취향에 맞는 작품들로 채워져 있습니다. 쇼핑몰에서는 이 상품과 함께 본 상품이 슬그머니 따라붙습니다. 이 모든 것이 우연은 아닙니다. 뒤에서 추천 시스템이 움직이고 있습니다.

이번 글에서는 추천이 어떤 원리로 정해지는지를 코드 없이 풀어 보겠습니다. 추천이 결국 무엇을 계산하는지, 그리고 그 추천이 어떻게 점점 더 내게 맞아 가는지를 비개발자 눈높이로 살펴보겠습니다.

추천은 결국 비슷함을 찾는 일입니다 #

추천 시스템이 하는 일은 한마디로 비슷함을 찾는 것입니다. 방향은 크게 둘입니다. 하나는 나와 취향이 비슷한 사람을 찾아 그 사람이 좋아한 것을 권하는 방법이고, 다른 하나는 내가 이미 좋아한 것과 비슷한 콘텐츠를 찾아 권하는 방법입니다.

둘 다 일상에서 늘 하는 일입니다. 취향이 잘 맞는 친구가 추천하는 영화는 한 번 믿고 보게 되고, 재미있게 본 영화와 같은 감독의 작품이라면 손이 갑니다. 추천 시스템은 이 두 가지 직관을 수많은 사람과 콘텐츠에 대해 자동으로, 큰 규모로 해내는 것입니다.

비슷한 사람을 따라가는 방법 #

첫 번째는 나와 취향이 겹치는 사람들을 단서로 삼는 방법입니다. 흔히 협업 필터링이라고 부릅니다. 나와 비슷한 것들을 좋아해 온 사람들이 즐겨 본 것 중, 내가 아직 보지 않은 것을 골라 권하는 방식입니다.

이 상품을 산 사람들이 함께 산 상품이라는 익숙한 문구가 바로 이 방법입니다. 콘텐츠의 내용을 일일이 분석하지 않아도, 사람들의 행동이 겹치는 패턴만으로 꽤 그럴듯한 추천이 나옵니다. 많은 사람의 선택이 쌓일수록 이 방법은 더 정확해집니다.

콘텐츠 자체의 닮음을 따라가는 방법 #

두 번째는 콘텐츠 자체가 얼마나 닮았는지를 보는 방법입니다. 영화라면 장르, 배우, 분위기 같은 특징을 따져 비슷한 작품을 권합니다. 내가 어떤 액션 영화를 끝까지 봤다면, 비슷한 장르와 배우의 다른 액션 영화를 권하는 식입니다.

이 방법은 사람들의 행동이 아직 충분히 쌓이지 않은 새 콘텐츠에도 쓸 수 있다는 장점이 있습니다. 갓 올라온 영상이라 아무도 보지 않았더라도, 특징이 비슷하다면 알맞은 사람에게 권할 수 있기 때문입니다. 실제 서비스는 이 두 방법을 섞어 씁니다.

클릭과 시청이 추천을 길들입니다 #

추천 시스템은 한 번 정해 두면 끝나는 것이 아닙니다. 내가 무엇을 눌렀는지, 얼마나 오래 봤는지, 중간에 껐는지 같은 행동이 다시 데이터로 쌓이고, 그 데이터가 다음 추천을 더 정교하게 다듬습니다. 쓰면 쓸수록 내게 맞아 가는 느낌이 드는 이유입니다.

이 행동 데이터가 제대로 쌓이려면 한 가지 전제가 필요합니다. 추천이 똑똑해지려면 사용자의 행동이 이벤트로 잘 기록되고 지표로 정리되어 있어야 합니다. 추천 시스템은 그렇게 모인 데이터를 연료로 삼아 돌아갑니다.

추천이 잘못 길드는 경우도 있습니다 #

추천이 늘 좋기만 한 것은 아닙니다. 내가 본 것과 비슷한 것만 계속 권하다 보면, 점점 비슷한 내용만 보게 되어 시야가 좁아질 수 있습니다. 흔히 필터 버블이라고 부르는 현상입니다.

또 사람들이 자극적인 콘텐츠에 더 오래 머무는 경향이 있다면, 그 행동을 따라 추천이 자극적인 쪽으로 쏠리기도 합니다. 추천은 사람들의 행동을 비추는 거울이라, 행동에 담긴 편향까지 그대로 따라갑니다. 그래서 많은 서비스가 일부러 새로운 종류의 콘텐츠를 섞어 넣어 균형을 잡으려 합니다.

왜 비개발자가 알면 일이 편해지는가 #

  • 추천을 한 걸음 떨어져 봅니다. 첫 화면에 뜬 것이 객관적 정답이 아니라 내 행동을 비춘 결과임을 알면, 추천에 끌려가지 않고 선택할 수 있습니다.
  • 기획에 활용합니다. 추천이 데이터를 연료로 삼는다는 점을 알면, 어떤 행동을 기록해 두어야 추천이 좋아지는지 미리 설계할 수 있습니다.
  • 한계를 설명합니다. 추천이 왜 가끔 한쪽으로 쏠리는지, 새 콘텐츠가 왜 추천되기 어려운지를 동료에게 차분히 풀어 줄 수 있습니다.

마무리 #

오늘은 유튜브와 넷플릭스로 대표되는 추천 시스템이, 비슷한 사람과 비슷한 콘텐츠를 단서로 추천을 만들고, 우리의 행동을 다시 연료 삼아 점점 정교해지는 흐름을 살펴봤습니다. 추천은 결국 비슷함을 찾는 일이며, 그 재료는 우리가 남긴 행동이라는 점이 핵심입니다.

추천에 쓰이는 AI가 어떻게 학습하는지 궁금하다면 AI,머신러닝,LLM 큰 그림을, 추천의 연료가 되는 데이터와 지표가 어떻게 쌓이는지 더 알고 싶다면 서비스 데이터와 로그는 어떻게 분석할까를 함께 읽어 보시길 권합니다.

X