Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента
Егоров Е.Ю.,
Сибирский федеральный университет, г. Железногорск, Россия
Современный интернет концентрирует множество всевозможных ресурсов и привлекает огромную аудиторию. Однако качество публикуемой информации имеют крайне низкое качество. Особенно остро данная проблема стоит при динамическом формировании и обсуждении конвента (например, ветки форумов). Зачастую, в соответствующих разделах тематических информационных ресурсов аудиторию можно разделить на тех, кто конструктивно ведёт диалог (находится в тематике ресурса), и тех, кто вносит дискомфорт в обсуждение профильного сообщества. В связи с тем, что администратор не может справиться с большим количеством поступающей информации, рационально ввести в возможности ядра ресурса интеллектуальную функцию классификации пользователей, которая бы разделяла их по интересам и по характеру влияния на качество тематического ресурса.
Применение классических методов пользовательского рейтинга не представляется эффективным. В работах Сухинина Д.И. [1] была сделана попытка комплексно проанализировать поведение пользователя при работе с тематическими ресурсами. Исходя из этого, можно говорить о необходимости ввода гибкой классификации пользователей. Это обусловлено в первую очередь тем, что в обсуждение темы может включиться не только разделяющий мнение авторов материала, но и имеющий противоположную точку зрения (как профессиональную, так и популистско-обывательскую). Очевидно, что в различных ситуациях ядру тематического ресурса необходимо будет вести себя по разносу. Введём классы пользователей:
Гость - не авторизованный пользователь, классифицировать которого система не имеет возможности и его права максимально ограничены.
Новичёк - недавно зарегистрированный пользователь ресурса, имеющего малую стаитсикуработы с материалом сайта и обладающего ограниченными возможностями.
Случайный пользователь -зарегистрированный в системе пользователь, проявивший активность на начальном этапе знакомства с ресурсом и потом потерявший к нему интерес.
Исследователь - это такой пользователь, который сохраняет свою активность в обращении к материалам ресурса и формировании контента в определённых информационных секторах тематического ресурса.
Спамер - активный пользователь, интенсивно рассылающий сообщения не по тематике ветки форума.
Эксперт-критик - пользователь, активно критикующий собеседников ветки форума, опираясь на здравый смысл и адекватные аргументы (без перехода на личности и без попыток унижения собеседника).
Провокатор - активный пользователь, провоцирующий своими сообщениями отдельную группу участников ветки форума обсуждения на резко негативную оценку.
Завсегдатай - активный пользователь, разделяющий идеологию тематического ресурса и обладающий дополнительными правами.
Агрессивный обыватель (вредитель) - активный пользователь, противостоящий идеологии тематического ресурса при опоре на популистско-обывательскую позицию.
Эксперт-единомышленник - активный пользователь, обладающий знаниями и опытом по тематике ресурса и разделяющий его идеологию.
Переходы между ролями осуществляются в процессе уточнения профиля пользователя системой, сопровождая их эволюцией прав от начальной конфигурации (нейтральной для новичка) в положительную или отрицательную стороны. В таблице представлена начальная параметрическая модель, характеризующая отдельные классы пользователей.
Таблица. Параметризация классов пользователей
ГруппаМнение пользователей -100%|+100%Кол-во публикацийКол-во проведённого времениГость---Новичок00-10Больше 2 днейСлучайный пользовательПоложительно0Больше 5 днейИсследовательПоложительно0-1Больше 7 днейСпамерМеньше (-5% ) - (-10%)0Больше 7 днейЭксперт-критикБольше 5-10%0-5Больше 1 месяцаЗавсегдатайБольше 25%Больше 5Больше 2 месяцевЭксперт-единомышленникБольше 75%Больше 10Более полугодаПровокаторМеньше (-10% ) - (-25%)Не учитываетсяНе учитываетсяВредительМеньше -50%0Меньше 10 часов
Тогда можно говорить о системе, которой необходимо принимать решения не только на базе однозначных показателей из таблицы, но и после анализа их поведения. В этой ситуации необходимо реализовать интеллектуальный алгоритм фильтрации контента, учитывая следующие допущения:
часть координирующих поведение сообщества сигналов поступает от модераторов или экспертов-единомышленников;
мнения провокаторов, вредителей, спамеров и новичков игнорируются при определении рейтинга обсуждаемого материала или других пользователей; интеллектуальная фильтрация контент пользователь
идеология тематического ресурса ориентирована на качество контента и объективность его оценки.
Предметы
Актуальные Статьи по программному обеспечению, программированию