В День народного единства "ВКонтакте" проведет эксперименты по борьбе с оскорблениями при помощи нейросетей
Блог ВКонтакте

Социальная сеть "ВКонтакте" объявила о проведении в День народного единства эксперимента "для борьбы с оскорблениями и травлей в комментариях". В рамках этого эксперимента компания протестирует новый функционал, позволяющий бороться с враждебными высказываниями.

"4 ноября ровно на сутки в настройках сообществ появится возможность включить фильтр враждебных высказываний. Нейросеть удаляет комментарии, в которых содержатся угрозы, - например, пожелания смерти или обещания причинить вред здоровью. При этом администратор сможет увидеть все комментарии, которые отсеял фильтр, и восстановить их или отправить автора в чёрный список. Как и другие фильтры в сообществах, фильтр враждебных высказываний можно включить или выключить в любой момент", - сообщили в компании, уточнив, что результаты эксперимента будут использованы для доработки нейросети.

Кроме того, соцсеть решила масштабировать прошлогодний эксперимент: когда пользователь пишет комментарий, алгоритмы определяют, есть ли в тексте признаки оскорблений. Если да, то автор получает совет не тратить время на агрессию и отказаться от обидной реплики. Год назад благодаря такому предупреждению за сутки удалось сократить количество оскорблений в комментариях на 36%.

"В этот раз функция будет определять более широкий спектр оскорблений и угроз. Среди них - проявления нетерпимости по национальному признаку, а также враждебные высказывания на почве религиозной принадлежности, возраста, пола и других характеристик. 4 ноября предупреждение смогут увидеть все пользователи, а позже начнётся долгосрочный тест, рассчитанный на часть аудитории", - добавили в соцсети.

О том, что "ВКонтакте" работает над алгоритмом для автоматического распознавания материалов с враждебными высказываниями, стало известно в августе. В компании тогда сообщили, что новая нейросеть поможет быстрее находить материалы с враждебными высказываниями, а также публикации, которые провоцируют аудиторию проявлять агрессию.

В январе-июне этого года из "ВКонтакте" было удалено 520 тыс. единиц контента, разжигающего вражду. Кроме того, было заблокировано 1340 профилей и 2470 сообществ, распространяющих враждебные высказывания.

Отметим, что другие соцсети также активно внедряют инструменты для отслеживания запрещенного контента. На внедрении таких инструментов и ускорении процесса удаления противоправного контента настаивают власти Евросоюза.