Степан Скрыльников, студент Пятигорского госуниверситета, один из разработчиков программы определителя фейковых новостей:
«Для задачи обработки языка, который, по сути, является обнаружением фейковых новостей, можно применить широкий спектр моделей машинного обучения. Мы выбрали одну из последних, которую разработали GOOGL, она называется BERT. С ее помощью можно создавать программы с искусственным интеллектом для ответов на вопросы в произвольной форме, чат-боты, переводчики, анализаторы текста и т.д.
За основу нашей модели мы взяли RuBERT, предобученный DeepPavlov. Мы, также, разработали конвейер для рутентной настройки моделей с целью распознавания фейковых новостей. Более того, мы выбрали гиперпараметры для настройки этой модели.
Во время работы учитывали индивидуальные требования клиентов и сошлись на том, что нужно использовать микросервисную структуру в нашей программе. В итоге, у нас получилась гибкая система классификации текста, которая, по сути, может быть внедрена в кратчайшие сроки в любой продукт. Модель умеет выставлять рубрику и некоторые теги.
На данный момент, все модели для английского языка находятся на стадии разработки. Ни одна так и не вышла в релиз. На российском рынке ситуация такая же.
В рамках конкурса «Fake News Classification» от «Сбербанка», наша модель вошла в ТОП-15 по точности из 1041 команды-участницы. Таким образом, мы можем сказать, что продукт на рынке является очень привлекательным и, более того, практически незаменимым.
Обеспечение защиты от Fake News, будет, по нашему мнению, необходимо двум типам клиентов. Первое, это государственные структуры для минимизации влияния Fake News в государстве. К ним относим СМИ, для лучшей фильтрации своих собственных источников. Второе – коммерческие организации, которые хотят защитить свою репутацию и капитал от намеренных атак.
Что касается финансовой монетизации проекта, она может осуществляться либо за счет предоставления платного доступа к пользовательской версии продукта или благодаря сервисному обслуживанию дружественных компаний или компаний-клиентов».