Какие параметры можем учитывать при составление рекомендаций на сайте?

Я вдохновлен ИИ, который показывает пользователям, что им интересно. Социальная сеть, форум, служба вопросов и ответов. Что нам можно учитывать при составлении рекомендаций? Какие данные следует собирать?

8 Симпатий

Давайте посмотрим, какие данные есть у Toxu. Они не реализованы на лицевой стороне, но эти данные есть.

  • Какие ответы / вопросы нравятся

  • Количество постов участника

  • Количество просмотров

  • Время чтения: если пользователи тратят много времени на чтение темы (с учетом количества сообщений), она будет более интересной, чем тема, в которой пользователи просматривают или закрывают ее после прочтения нескольких сообщений.

  • Тема с несколькими ответами на сообщения (для форумов). В теме с большим количеством ответов на сообщения может происходить интересное обсуждение.

  • Подписка на тему: если пользователи отслеживают / наблюдают за темой с интересом, она будет более полезной, чем обычно.

  • Количество постов, добавленных в закладки. Если многие посты добавляются в закладки, в теме может содержаться важная информация.

  • Большое количество лайков: если в одном сообщении необычное количество лайков по сравнению с другим, это может вызвать интерес сообщества.

  • Количество пользователей в теме: большое количество пользователей, скрывающихся в теме, может указывать на интересную дискуссию.

  • Репутация пользователя: пользователь с более высоким уровнем доверия и репутацией (значки, решения, лайки) склонен иметь темы более высокого качества. Аналогично, пользователь, который был отмечен, например, несколько раз флагом, будет склонен публиковать темы низкого качества.

  • Реферальный трафик. Если тема получает много внешнего реферального трафика, это может заинтересовать сообщество.

Кроме того, пользователь будет более заинтересован в контенте, который приспособлен к его вкусу. Например:

  • Интерес пользователей: если пользователь отслеживает / наблюдает за разделами / подразделами, он с большей вероятностью найдет тему среди этих интересных. Аналогично и с тегами.

  • Понравившиеся пользователи: если мне постоянно нравятся сообщения пользователей, я склонен находить их содержание более интересным. Показ тем, начатых наиболее понравившимися пользователями, будет представлять интерес.

  • Потенциальный интерес пользователей. С другой стороны, пользователям также может быть показано небольшое количество тем из разделов, которые они не просматривают / не отслеживают, в случае, если это представляет потенциальный интерес.

Как и в текущей системе, администраторы смогут устанавливать веса и настраивать их по своему вкусу. Но тут необходима математика.

Т.е. при проектирование, если мы делаем действительно интерактивную систему, а не статическую, кой век видимо почти прошел (давайте не будет жить вчерашним днем). Нам необходимо собирать эти данные.

Эта дискуссия ведется:

8 Симпатий

Основной параметр тут, это время чтение. Времени на сайте уделяется много значения. Это не упрощенный график справа, который обобщает лишь общее время.

  • Вы только зашли и публикуете ссылку?
  • А сколько вы читали Faq? 5 секунд? Хм…
  • Вы перечитываете посты, вам интересно?
  • Вы набираете тест слишком быстро…

Это лишь несколько пунктов, из огромного перечня, что мы считаем очень важным. Время.

Сбор данных, чтобы их можно было использовать, зависит от задач. Что мы хотим получить?

Многое зависит от модели сообщества. Например, на Reddit подобных системах получают больше других данных, чем мы получаем на Toxu. Но есть такие тут, про которые там и не слышали. Это не связанно со скриптом, как многие думают, но лишь с задачами. Программу стороят под задачи.

Лайки. Плюс и минус. Мы записываем их. Куда проще? Что еще можно придумать?

По ссылке выше, показаны размышления по поводу лайков. “Расстоянии” между пользователями и некоторые другие данные, для работы с кармой и постами. Там задача карма. Она успешно была реализована и есть даже несколько научных работ по этому делу.

Если мы говорим, что 1 лайк = 1, и строим линейную зависимость, то текст выше можно не читать, он не нужен. Но ведь, лайки от разных людей, это разные лайки. Так? В общем, хорошая статья и хороший алгоритм, который они построили.

5 Симпатий