Рекомендовано! Но почему?
Все что надо знать о видео-рекомендательных сервисах
В эпоху классических СМИ мир был простым. Все понимали, что «попса» — это контент крупных телеканалов, радиостанций и газет. А остальное – не более чем нишевые продукты для увлеченных. С приходом эпохи социальных сетей сформировался совершенно новый механизм: теперь каждому пользователю привычно иметь свой «фид», новостную ленту или набор рекомендуемых видео по тематике. Оставляя за скобками философские вопросы о том, как эта новая медийная реальность влияет на общество и культуру, разберемся на практическом уровне, какова логика и алгоритмы формирования этих подборок.
Правило взаимообмена
Первое, что важно понять: система рекомендаций может и должна быть взаимовыгодной для пользователя и поставщика услуг. Контент-провайдер собирает информацию о предпочтениях аудитории и получает инструменты дополнительных продаж, в то время как для клиента облегчается процесс навигации по каталогу, особенно когда он сам не уверен, чего именно хочет. Зачастую в погоне за сухими цифрами CTR и конверсии легко забыть о реальном контакте с людьми, но для рекомендаций это принципиальный момент! Пользователь должен чувствовать, что предложение – это не просто базарная попытка «впарить» ему дополнительную ненужную покупку, но часть сервиса высокого уровня, помогающая определится с его собственными предпочтениями. Более того, для сервисов, предоставляющих контент по подписке, прямой монетарной выгоды рекомендации не несут вообще; зато они способствуют повышению уровней лояльности и вовлечения, давая человеку повод больше времени проводить на платформе и возвращаться вновь и вновь.
Типы рекомендаций
Метод простой выборки, как нетрудно догадаться из названия, является самой примитивной рекомендательной механикой. Здесь система просто выстраивает унифицированное предложение для пользователей на основе общей популярности наименований. По сути, простота имплементации остается единственным преимуществом такой системы, что делает ее самодостаточной лишь для платформ, строящих свою стратегию на продвижении «звездных» наименований (например, высокобюджетных голливудских блокбастеров).
В случает с редакторским методом, небольшой коллектив экспертов выступает в качестве опытных «сомелье» и делится с аудиторией своими рецензиями. Существуют два основных варианта формирования такого коллектива. В первом случае это авторитетные профессиональные критики, работающие в штате компании. Во втором, платформа содержит социальный элемент, позволяющий зрителям самим оставлять рецензии и «прокачивать» свой аккаунт, набирая уровень доверия других пользователей. Этот механизм вряд ли может служить самостоятельной заменой другим рекомендательным системам; скорее его стоит рассматривать как дополнение, способствующее более глубокому вовлечению аудитории в пользование платформой.

Наконец, персонализированный метод – это обобщенное название для всех вариаций более продвинутых механик, составляющих индивидуальные рекомендации для пользователей. Параметров отбора тут может быть великое множество, а алгоритмов их обработки еще больше, поэтому далее рассмотрим наиболее часто встречающиеся варианты.
Критерии
Самым очевидным параметром являются, конечно же, жанровые предпочтения. При этом степень детализации по параметру потенциально неограничена. Да, можно остановится на самой базовой классификации: комедии-драмы-боевики-детективы-всё. Но не даром в искусствоведении жанр определяется всего лишь как «набор типичных повторяющихся тропов» - что на практике означает возможность «зацепится» за любой из них. Например, поклонники фантастической литературы или рок-музыки просто обожают зарываться в под-под-поджанры, исследовать инди-сцену и андерграунд. И если это часть аудитории, которую вы хотите привлечь, неплохой идеей будет отделить Кибер-панк от Стим-панка, а Готенбергскую школу death-metal от Хельсинкской.

Второй по популярности критерий - участники съемочной группы. Конечно, вряд ли вы найдете большое количество поклонников, всерьез интересующихся работой операторов, осветителей, гримеров. Но даже участие в проекте конкретного продюсера вполне может быть знаком качества для некоторой доли аудитории, а уж актеры и режиссеры и вовсе являются в современном мире одними из главных звезд и зачастую на личной репутации приводят к экранам не меньше зрителей, чем тематика и сюжет фильмов.

Страна производства – это, опять же, набор типичных ходов и приемов, не обязательно вынесенных в жанровую классификацию, но узнаваемых и даже ожидаемых, особенно среди поклонников. Будь то песни и пляски в индийских фильмах, арт-хаусный изобразительный язык скандинавского кино или своеобразная лирично-романтическая французская атмосфера, но традиция, из которой происходят создатели, не может не влиять на их художественное видение. Сюда же можно отнести и время выхода, декаду или даже конкретный год в развитии кинематографа.

Язык оригинала, дубляжа и субтитров частично пересекается с предыдущим пунктом, но является более техническим параметром. Его важность может быть связана не только со вкусовыми предпочтениями, но и с сознательным желанием использовать контент для изучения языка или даже неспособностью пользователя воспринимать язык на достаточном уровне (особенно в интернете, где почти не существует территориальных границ).
Обратите внимание, что многие из этих критериев обладают высоким потенциалом для формирования вокруг них общения и даже фан-сообществ на тех платформах, которые заинтересованы в добавлении не только функциональных, но и социальных элементов. Это может быть крайне полезно, так как при наличии достаточной свободы у пользователей (внесение правок, рецензирование, обсуждение в комментариях) фан-клубы могут сами создавать контент и активность вокруг объектов своей любви (особенно актеров).
Математика
По типу/степени включенности пользователя, сбор данных условно делят на прямой и косвенный. Прямым называют непосредственные активные действия: покупку, выставление оценок, написание отзывов и участие в обсуждениях. К непрямому сбору данных относят любые потенциальные проявления интереса, будь то клики, чтение описаний или неоконченный просмотр контента. При этом данные прямого сбора закладываются в алгоритмы как имеющие большую статистическую весомость.

Обработка «холодного старта»

Этим термином называют период первоначального накопления статистики, которой системе еще недостаточно для принятия правильных решений. Например, новый пользователь только что создал аккаунт и пока что о нем и его пожеланиях ничего не известно. Тут возможны два основных подхода:

1. Платформа сразу формирует раздел рекомендаций на основе простой выборки (т.е. общих рейтингов, см. выше), а затем уже по мере накопления детальной информации об активности пользователя уточняет запрос, делая его более персонализированным.
2. Система предлагает пользователю начать с выставления некоторого количества оценок (например, любимым старым фильмам), на основе которых будет выполнен предварительный анализ. Здесь есть неожиданный подводный камень – как выясняется, людям свойственно на этом этапе давать ответы, как бы «презентующие» их с определенной стороны, не обязательно соответствующей действительности: например, включать больше заслуживших уважение классических названий, игнорируя контент, имеющий условный статус «попсы», даже если последний они потребляют гораздо чаще.

Возможно наиболее математически продвинутой механикой рекомендаций является коллаборативная фильтрация, основанная на просчете референтной группы. На базе оценок пользователя (а потенциально и иных проявлений его интереса), создается корреляционное поле, учитывающее совпадение вкусов с другими профилями. Чаще эти данные остаются «подводными», доступными только самой системе, но некоторые платформы так же делают из нее элемент социального взаимодействия, предлагая пользователю: «вот ваши единомышленники со схожими вкусами, можете с ними познакомиться». В любом случае, совпадение мнений система использует для уточнения предсказаний, ведь оценки референтной группы ожидаемо более релевантны, чем усредненные общие рейтинги.
Еще один момент, на который стоит обратить внимание – каков потенциал повторного воспроизведения контента. Допустим, для новостных материалов этот коэффициент будет крайне низким: скорее всего, лишь люди с профессиональной заинтересованностью станут пересматривать их вновь. А вот ко всевозможным обучающим видео пользователи могут возвращаться по многу раз. Аналогично и с новостной ценностью: для обзора спортивных или политических событий фактор новизны зачастую важен буквально до часов, а разбор текста «Евгения Онегина» не утратит актуальности и спустя годы после первоначальной заливки. Конкретные решения могут быть разными – от введения в алгоритм вероятности показа специальных коэффициентов поправки на новизну до создания самостоятельных разделов рекомендаций («Новости», «Повторный просмотр», «Понравившиеся» и т.д.) – но так или иначе эти факторы важно учесть, чтобы рекомендации не заполнялись бесполезным контентом, а актуальный попадал туда своевременно.

Что касается механизма показа рекомендаций, это задача на стыке функциональности и дизайна, для которой важнее всего выдерживать тонкий баланс между постоянным присутствием на виду и неназойливостью. Подобно тому, как искусство опытного официанта или метрдотеля описывают словами «быть всегда под рукой, когда он нужен», панель рекомендаций, будь то фиксированная секция экрана, овер-лей или отдельный пункт меню, должна время от времени аккуратно напоминать о себе, но ни в коем случае не раздражать.