Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента

  • Вид работы:
    Статья
  • Предмет:
    Информационное обеспечение, программирование
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    4,82 Кб
  • Опубликовано:
    2013-11-15
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента














Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента


Егоров Е.Ю.,

Сибирский федеральный университет, г. Железногорск, Россия

Современный интернет концентрирует множество всевозможных ресурсов и привлекает огромную аудиторию. Однако качество публикуемой информации имеют крайне низкое качество. Особенно остро данная проблема стоит при динамическом формировании и обсуждении конвента (например, ветки форумов). Зачастую, в соответствующих разделах тематических информационных ресурсов аудиторию можно разделить на тех, кто конструктивно ведёт диалог (находится в тематике ресурса), и тех, кто вносит дискомфорт в обсуждение профильного сообщества. В связи с тем, что администратор не может справиться с большим количеством поступающей информации, рационально ввести в возможности ядра ресурса интеллектуальную функцию классификации пользователей, которая бы разделяла их по интересам и по характеру влияния на качество тематического ресурса.

Применение классических методов пользовательского рейтинга не представляется эффективным. В работах Сухинина Д.И. [1] была сделана попытка комплексно проанализировать поведение пользователя при работе с тематическими ресурсами. Исходя из этого, можно говорить о необходимости ввода гибкой классификации пользователей. Это обусловлено в первую очередь тем, что в обсуждение темы может включиться не только разделяющий мнение авторов материала, но и имеющий противоположную точку зрения (как профессиональную, так и популистско-обывательскую). Очевидно, что в различных ситуациях ядру тематического ресурса необходимо будет вести себя по разносу. Введём классы пользователей:

Гость - не авторизованный пользователь, классифицировать которого система не имеет возможности и его права максимально ограничены.

Новичёк - недавно зарегистрированный пользователь ресурса, имеющего малую стаитсикуработы с материалом сайта и обладающего ограниченными возможностями.

Случайный пользователь -зарегистрированный в системе пользователь, проявивший активность на начальном этапе знакомства с ресурсом и потом потерявший к нему интерес.

Исследователь - это такой пользователь, который сохраняет свою активность в обращении к материалам ресурса и формировании контента в определённых информационных секторах тематического ресурса.

Спамер - активный пользователь, интенсивно рассылающий сообщения не по тематике ветки форума.

Эксперт-критик - пользователь, активно критикующий собеседников ветки форума, опираясь на здравый смысл и адекватные аргументы (без перехода на личности и без попыток унижения собеседника).

Провокатор - активный пользователь, провоцирующий своими сообщениями отдельную группу участников ветки форума обсуждения на резко негативную оценку.

Завсегдатай - активный пользователь, разделяющий идеологию тематического ресурса и обладающий дополнительными правами.

Агрессивный обыватель (вредитель) - активный пользователь, противостоящий идеологии тематического ресурса при опоре на популистско-обывательскую позицию.

Эксперт-единомышленник - активный пользователь, обладающий знаниями и опытом по тематике ресурса и разделяющий его идеологию.

Переходы между ролями осуществляются в процессе уточнения профиля пользователя системой, сопровождая их эволюцией прав от начальной конфигурации (нейтральной для новичка) в положительную или отрицательную стороны. В таблице представлена начальная параметрическая модель, характеризующая отдельные классы пользователей.

Таблица. Параметризация классов пользователей

ГруппаМнение пользователей -100%|+100%Кол-во публикацийКол-во проведённого времениГость---Новичок00-10Больше 2 днейСлучайный пользовательПоложительно0Больше 5 днейИсследовательПоложительно0-1Больше 7 днейСпамерМеньше (-5% ) - (-10%)0Больше 7 днейЭксперт-критикБольше 5-10%0-5Больше 1 месяцаЗавсегдатайБольше 25%Больше 5Больше 2 месяцевЭксперт-единомышленникБольше 75%Больше 10Более полугодаПровокаторМеньше (-10% ) - (-25%)Не учитываетсяНе учитываетсяВредительМеньше -50%0Меньше 10 часов

Тогда можно говорить о системе, которой необходимо принимать решения не только на базе однозначных показателей из таблицы, но и после анализа их поведения. В этой ситуации необходимо реализовать интеллектуальный алгоритм фильтрации контента, учитывая следующие допущения:

часть координирующих поведение сообщества сигналов поступает от модераторов или экспертов-единомышленников;

идеология тематического ресурса ориентирована на качество контента и объективность его оценки.

Тогда параметрами для принятия интеллектуальным фильтром (экспертной системой) решения будут следующие:

консолидированное мнение «полезных» пользователей о конкретном члене тематического сообщества относительно отдельной в ветке форума;

обобщённая статистика посещаемости ресурса (временной, частотный, деятельностный аспекты);

объём публикованного материала (документы, статьи, презентации) и его качество (оценка премодерации);

оценка семантического «вектора» высказываний, относительно идеологии тематического ресурса (включая семантический анализ высказываний на форуме).

Предложенная группировка и параметризация пользователей позволит повысить качество фильтрации нежелательного контента. Она способствует выработке соответствующих мер ядром тематического ресурса по явному (предупредления, ограничение прав, блокировака) или косвенному [2] противодействию злонамеренным попыткам формирования неадекватного контента как в рамках форума, так и всего ресурса.

Литература

1. Сухинин Д.И., Углев В.А. Проблематика самоорганизации профильных интернет сообществ // Измерение, контроль, информатизация: Материалы IX Международной конференции. - Барнаул: АлтГТУ, 2008. - С. 233-236.

. Стюгин М.А., Беда И.А. Алгоритм построения защищённых от информационных исследования систем // Системный анализ и информационные технологии: Материалы V Международной конференции. В 2 т. Т.2 С. 419-423.

Похожие работы на - Классификация пользователей форумов тематических ресурсов для разработки алгоритмов интеллектуальной фильтрации контента

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!