Технологии

Ученые придумали алгоритм по выявлению интернет-троллей до того, как они успели устроить свару в комментах

время публикации: 21 апреля 2015 г., 20:12 | последнее обновление: 21 апреля 2015 г., 20:54

Изображение trollface, созданное в 2008 году художником Whynne

wikipedia.org

Изображение trollface, созданное в 2008 году художником Whynne
wikipedia.org

Исследователи из Стэнфордского и Корнелльского университетов в США, воспользовавшись грантом Google, разработали алгоритм, позволяющий с 79-процентной точностью определять "троллей" на интернет-ресурсах по пяти первым сообщениям.

Работа ученых опубликована на сайте библиотеки Корнелльского университета. Авторы работы утверждают, что разработанный ими алгоритм может использоваться в качестве вспомогательного инструмента в работе модераторов, передает CNews.

Тролль в интернете - человек, который ведет себя вызывающе, оскорбительно, провоцирует других участников на острую реакцию. В поисках таких провокаторов исследователи проанализировали 40 млн комментариев, оставленных 1,7 млн пользователями, а также 100 млн оценок этих комментариев другими участниками обсуждений на новостном сайте CNN.com, новостном ресурсе о политике Breitbart.com и игровом сайте IGN.com, использующими веб-сервис для обсуждений Disqus. На сбор данных ушло 18 месяцев.

Затем авторы работы сравнили поведение пользователей, которые впоследствии были "забанены", с пользователями, которые не были "забанены" ни разу, и пришли к выводу, что поведение этих двух групп существенно отличается.

Во-первых, тролли предпочитают концентрироваться на беседах с конкретными участниками в групповом обсуждении. Во-вторых, они склонны оставлять неуместные комментарии. В-третьих, в их фразах чаще присутствует ненормативная лексика, чем во фразах представителей другой группы. В-четвертых, они чаще всего получают отклики от других участников беседы, таким образом расходуя их время на бесцельную болтовню.

Брать тролля "горяченьким"

Исследователи также выяснили, что постепенно в беседах агрессия троллей возрастает и они вызывают все большее неприятие других участников. Если же другие участники отвечают троллю грубо, то беседа принимает еще более негативный характер. При этом, по словам исследователей, чем дольше тролль принимает участие в беседе, тем сложнее его определить. Скорее всего, это связно с изменением поведения других участников в беседе, предположили они.

Что касается вопроса, создают ли тролли обсуждения сами или присоединяются к уже существующим, однозначного ответа исследователи не дали. По их словам, это зависит от конкретного сайта. Например, на Breitbart.com и IGN.com тролли преимущественно начинали общение с ответов на комментарии других пользователей, тогда как на сайте CNN.com они преимущественно сами инициировали обсуждения.

Ученые не говорят, когда разработанный ими алгоритм появится в Сети.