Всем привет.
Хотел бы рассказать про наш(я и M0sTik) проект. Над которым уже некоторое время идет работа.
Суть в том, что я заметил, что ВКонтакте появилось немереное количество публичных страниц. Каждая из них поначалу предоставляет интересные посты, на затем "порох" заканчивается и по сути идет полнейший треш. Плохие группы исчезают, хорошие появляются но пользователям лень переходить из группы в группу, они просто сидят на старых пабликах и читают все, из которых 1/3 это что то нормальное, 1/3 плоский юмор и 1/3 реклама. Да и на новых, хороших пабликах обязательно находится то, что явно не хочется читать.
В общем как то мне пришла в голову идея сделать публичную страницу, которая сможет отбирать лучшее из существующего, так сказать высшая степень лени :). Так его и назвали LNT(ЛеНТяй).
Для тех, кто уже захотел это увидеть, вот ссылка: LNT.
Запущен он был пару дней назад. За чуть больше суток тут уже больше 70 постов. Пост здесь немного отличается от обычного паблика. Если в одном посте обычного паблика лежит в среднем одна фотография, то мы делаем подборки по группам. Почему? Ответ тут, это две причины:
1). Прочитал я, что ВКонтакте делает ограничение на количество публикаций, если не писать ту большую схему, то можно сказать грубо: один пост в десять минут. Этого мало, учитывая объемы постов, с которыми мы работаем, а так же разноплановость аудитории, которой хочется достичь.
2). Причина крайне банальна, не стоит мешать соль с сахаром. Есть люди, которым нравится "парашный" юмор и провокации, есть интеллигенты, а есть и дамы. У каждого свои вкусы. Группировка по пабликам, это хорошее решение, как по мне.
Таким образом за день тут накапливается колоссальное количество публикаций. По текущим результатам подборки выходят не столь и плохими(когда как). Некоторым это может и не нравится, всем не угодишь. Но подборки ориентированы на общую массу.
Теперь по поводу "мозга, сердца и мышц" нашего паблика(алгоритм и код):
Основная работа состоит из нескольких основных кусков:
1). искать
2). выбирать
3). публиковать
Вся техническая часть, и конечно же масса кода лежит в первом и третьем пункте. Второй пункт это основная алгоритмическая часть. Собственно тут еще лежит куча доработок и оптимизаций. Полностью всю логику я не могу тут написать, но суть тут лежит в следующей оптимизационной задаче:
в реальном времени Вам поступает публикация, в которой есть информация, картинки, вложения, лайки, репосты, комментарии, время публикации, размер публики страницы. В короткие сроки( ~ 10 минут), определить хорош ли он, или нет. Как упражнение, можете сами подумать над этой задачей, скажу, что тут можно придумать массу всяких способов выбора. Но в целом, это очень интересно.
Проблема такой задачи, тяжкий и долгий дебаг. Что бы убедиться, что тут публикуется то что нужно , ждать приходится около дня, пока весь анализ выполнит свою работу.
Помимо основной части, тут еще нужно доработать и создать не мало деталей.
Еще чуть чуть, и думаю можно начинать полноценную рекламу всего этого.
Интересно услышать Ваши отзывы по этому поводу.
P.S. Просьба не кричать, что я тут развращаю аудиторию, своими публикациями, я этого очень не хочу :).