Sophos и ReversingLabs опубликовали базу, насчитывающую 20 миллионов образцов исполняемых файлов для Windows, включая 10 миллионов семплов вредоносных программ. Всё это добро предназначено для исследователей в области кибербезопасности.
Помимо самих вредоносов, в базе содержатся также описания файлов, метаданные и прочая полезная информация, которая будет весьма полезна при анализе современных образцов зловредов.
БД выложили на GitHub. Согласно замыслу специалистов Sophos и ReversingLabs, их подборка поможет усовершенствовать модели машинного обучения, призванного детектировать вредоносные программы.
«Сбор и подготовка большого количества семплов с подробной информацией по каждому из них — довольно затратная и сложная процедура. Если делиться такой базой данных, то можно столкнуться с другими проблемами: защитой интеллектуальной собственности и риском заразить третьи стороны вредоносными программами», — отметили в Sophos.
Тем не менее эксперты собрали базу, получившую имя «SoReL-20M». Среди 10 миллионов зловредов, содержащихся в этой БД, нет по-настоящему опасных, поскольку исследователи убрали основную вредоносную функциональность.
Другими словами, если даже киберпреступники попытаются использовать опубликованную базу в своих целях, им потребуются серьёзные навыки и много времени, чтобы привести семплы в «боевое состояние».
Однако в Sophos понимают, что подготовленные злоумышленники в теории могут изучить выложенные образцы и создать на их основе свои инструменты для атаки. Но польза для исследователей превалирует.
Источник: anti-malware