У пользователей социальной сети НовГУ возник вопрос о подсчете статистики блогов. На первый взгляд кажется, что она считается некорректно. Однако это не так. Механизм подсчета статистики социальной сети разработан фирмой IBM по работает по своим собственным правилам. Механизм не очень прозрачен, но я попробую продемонстрировать правильность его работы.
В разделе общедоступные блоги в правом столбце находится несколько разделов:
-
Избранные блоги;
-
Наиболее понравившиеся;
-
С наибольшим числом голосов;
-
Наиболее комментируемые;
-
Наиболее посещаемые.
Избранные блоги. Здесь все очень просто - сюда попадают все последние записи в блогах. Чем позже была сделана запись, тем выше она будет в этом списке:
Наиболее понравившиеся. Здесь все блоги сортируются по количеству кликов «Мне нравится» в заголовке блога. Чем больше кликов, тем выше запись в списке наиболее понравившихся:
С наибольшим числом голосов. В данном списке все блоги сортируются по количеству проголосовавших за блог. Пример:
Наиболее комментируемые. Здесь тоже все стандартно. Чем больше комментируется блог, тем выше он в списке.
Пример комментариев блога:
С вышеописанным все в прозрачно. Вопросы обычно возникают с разделом «Наиболее посещаемые». Наиболее посещаемые могут быть записи в блогах и наиболее посещаемые блоги. Наиболее посещаемые записи:
Наиболее посещаемые блоги:
Позиция блога или записи блога в этом списке зависит от того, сколько раз произошло обращение к этой странице. т.е. ее открывали. При этом не важно, один и тот же человек ее открывает, или разные люди. Счетчик увеличивается на единицу после каждого открытия страницы любым пользователем. Например:
186 посещений:
После обновления страницы по Ctrl+F5 – уже 187 посещений:
С наиболее посещаемым блогом все сложнее. Число, фигурирующее напротив имени и фамилии блоггера – комплексное. Оно считается по определенной формуле, зависящей от множества других параметров. В том числе и условия, зависящие от параметра «время». Т.е. это не просто количество посещений, это некий рейтинг блоггера на данную минуту. Далее я буду называть это число именно рейтингом. Этот рейтинг зависит от того, сколько раз другие пользователи социальной сети открыли страницу личного блога данного пользователя со списком записей, сколько раз произошло обращение к уникальным записям в личном блоге. Сколько раз были просмотрены блоги пользователя в рамках сообществ (открытых и закрытых). Сколько раз были просмотрены комментарии данного пользователя к записям блогов других пользователей, а так же в открытых и закрытых сообществах.
Сейчас в топе числится пользователь с рейтингом 83 305. На первый взгляд кажется, что набрать такой рейтинг нереально. Но могу привести личные подсчеты (внутреннюю системную статистику смотреть сложно, но несколько позиций мне удалось достать):
Общая сумма просмотров уникальных записей в блоге у данного пользователя – 14 192 (т.е. 14 192 раза сообщения блога были открыты не списком, а уникальным обращением с целью детального просмотра или комментирования). Я на всякий случай даже посчитал вручную, используя число обращений, опубликованное напротив записи блога – действительно более 14 000 обращений в 109 записям).
Обращение к общей странице блогов со списком записей – 48 348. Это уже 62 540 только на уровне общедоступного блога.
Добавляем сюда количество просмотров комментариев, работу в блогах закрытых и открытых сообществ – и легко набираем недостающие 20 000 рейтинга.
Кроме того, нужно помнить, что рейтинг обновляется не сразу, а один раз в 15-20 минут.
Более того, система социальной сети не просто отображает одних и тех же людей в этом списке. Происходит фильтрация по времени написания записей. Люди, имеющие высокий рейтинг, но давно не писавшие в блоге пропадают из списка наиболее посещаемых. Их заменяют люди, имеющие рейтинг ниже, но писавшие в блог недавно. Так, Марат Юзбеков писавший 13 декабря был удален из списка, а Альбина Птушкина, писавшая 23 декабря, была добавлена в самый верх этого списка, не смотря на то, что ее рейтинг ниже чем у Марата Юзбекова. Та же самая причина исчезновения из списка у Елены Луковицкой, Сергея Попова, Елены Михайловой и еще многих других пользователей. Они были заменены на Ольгу Чувакову, Дарью Терешнику, Дмитрия Мадая и Александра Ласунского, рейтинг которых ниже, но отписались в блогах они позднее:
PS: Пока писал этот обзор поднял статистику одного пользователя с 83 305 до 83 340. Целых 35 пунктов добавил.
Comments (4)
Уважаемый Константин Юрьевич!
Благодарим Вас за титанический труд, который Вы проделали.
Впрочем, в той части, где, как Вы пишете, "все прозрачно", у меня лично и был вопрос. По поводу записей, наиболее комментируемых. Мы действительно наивно думали, что сколько комментариев, столько их и отражается в вашей статистике, разработанной умной компанией IBM. Вы сами это же и подтверждаете: "Здесь тоже все стандартно. Чем больше комментируется блог, тем выше он в списке". Почему тогда справедливо, с восемью комментариями, отражался блог о видеоконференции на портале НовГУ, и некорректно (может быть, просто непрозрачно?) - наиболее обсуждаемый блог о постоянно меняющихся рабочих программах (при 7 комментариев в вашей статистике значилось 2)? Вот конкретно про этот сложный случай напишите, пожалуйста, просто, для всех пользователей.
И еще. Главное, на мой взгляд.
Я против всякого рейтинга блогов. И тем более - рейтинга блогеров. Настоящим блогерам этот рейтинг не нужен, они пишут то, что наболело или просто чем хочется поделиться. Универсантов, публикующих в разделе "блоги" новости из раздела, например, "молодежная наука" (и закрытые для комментариев), а также вывешивающих оценки студентов (что, кстати, не совсем корректно, т.к. обнародовать оценки, как личные данные, не принято) - так вот, таковых пишущих еще нельзя считать блогерами. Или тогда раздел "блоги" вообще теряет смысл. Можно ограничиться сообществами и страницами подразделений.
Дарья Борисовна, вопрос Ваш понял. Но точно на него ответить не смогу - в силу давности ее написания, запись о рабочих программах в блоге Елены Луковицкой не поднимается (и вообще не появляется) в списке наиболее комментируемых. Я попробовал написать там еще один комментарий для эксперимента, но, к сожалению, даже это не помогает.
Так же я провел несколько экспериментов чтобы обнаружить ошибку, перелопатил системные таблицы (метрики) записи про рабочие программы и нескольких других записей (в частности про видеоконференцию). У записи про программы сейчас три параметра - 8 комментариев от пользователей, 0 лайков (мне нравится) и 278 посещений. Аналогично правильные данные в таблицах и по остальным записям. Так же я не нашел никаких ошибок подсчета или неточностей в работе социальной сети - потому затрудняюсь ответить на вопрос "почему в списке наиболее комментируемых напротив записи было 2 а не 7" - я это дело пропустил а сейчас это уже не повторить. Могу только предположить кэширование данных браузером (чтобы посмотреть актуальную информацию можно нажать Ctrl+F5).
Я так же провел несколько экспериментов с расставлением лайков и комментированием других записей в блогах. Все они корректно изменили статистику и система соцсети корректно отобразила записи в различных списках сортировки. Уж не знаю что и предположить на счет записи про рабочие программы - все должно быть правильно. Обещаю понаблюдать за статистикой и отписаться, если найду какие-то проблемы.
Что касается общего рейтинга блогов, блоггеров и записей и т.п., то проблема такая есть. Многим это не нравится, вызывает вопросы, некоторые пользователи пытаются "накрутить" статистику. Зачем - большой вопрос. Но полностью отказаться от рейтингов невозможно, даже если бы этого сильно хотелось. Наша система соцсети всё подсчитывает и сортирует согласно общепринятым законам блогосферы. И эти рейтинги - не наша выдумка, а некоторая необходимость. Скорее всего в каких-то условиях они очень полезны и правильны. Другой вопрос, что они не совсем подходят для нашей ВУЗовской среды. Да и люди пока не совсем правильно используют блоги и соцсеть в целом. Но правильному использованию мы будем учиться сами и учить других. А пока придется мириться с существующим положением дел.
В целом я бы порекомендовал всем пользователям поменьше смотреть на статистику и побольше писать на различные интересные темы. Кстати по наводке Николая Васильевича с удовольствием прочитал вашу последнюю запись "Зачем мы нужны, или О литературе". Очень понравилось, отметился в Лайках и вообще всем рекомендую почитать.
Забыл добавить, что вся статистика считается автоматически. Никто ее не подтасовывает. Рейтинги и списки так же составляются автоматически. Блоги, сообщества, записи и т.п. никто не модерирует, не редактирует и не фильтрует.
Константин Юрьевич, спасибо большое. Прежде всего за честность (система, несомненно, в том числе самая умная, дает сбой), а также за разъяснения. Вообще понятно, что даже в наших спорах мы скорее союзники, чем оппоненты, не говоря уже о концептуальном отношении к сайту, к его разделам, к людям, так или иначе принимающим участие в его облике, - в этом я полностью с Вами солидарна. Что же, будем работать для общего блага - вместе.
Что касается записи о литературе - спасибо, что прочли. И спасибо Николаю Васильевичу. Важно, что он-то читает как раз не по должности и советует прочесть тоже по-человечески, а не как руководитель. Кстати, страничка поэзии ведь появилась по его инициативе, а не по нашей, литераторов. Мы только подбирали и выверяли тексты. В целом, то, что сайт НовГУ находится в списке лучших из сайтов вузов, - думаю, справедливо (со многими из них приходится работать, есть с чем сравнить).
Еще раз благодарю.