Мы на пути к созданию ИИ-микроскопа, который будет находить интересные объекты, не зная, что именно нужно искать.

Искусственный интеллект, способный имитировать человеческое творчество, теперь может генерировать искусственные научные данные, что становится новым шагом к полностью автоматизированному анализу данных.

Ученые из Университета Иллинойса в Урбане-Шампейне создали искусственный интеллект , который генерирует синтетические данные, основанные на результатах микроскопических экспериментов, обычно применяемых для изучения структуры материалов на атомарном уровне.

Используя технологии, аналогичные тем, что применяются в генеративных ИИ, созданная нейросеть способна добавлять в сгенерированные данные фоновый шум и несовершенства эксперимента, что ускоряет и упрощает выявление свойств материалов.

Изображения, обработанные CycleGAN, сохраняют типы и положения дефектов атомов из исходных смоделированных изображений

В материаловедении уже активно применяются различные методы искусственного интеллекта и машинного обучения для анализа данных, но эти методы требуют постоянного и затратного участия человека. Увеличение эффективности этих процедур предполагает использование большого объема размеченных данных, что позволяет программе лучше понять, что именно ей нужно искать. Однако, данные должны учитывать широкий спектр фонового шума и экспериментальных неточностей, что затрудняет их моделирование.

Поскольку сбор и маркировка такого объема данных с использованием реального микроскопа является нереализуемой задачей, учёные разработали генеративный ИИ, способный создать большой объем искусственных обучающих данных на основе сравнительно небольшого набора реальных размеченных данных.

Два микроскопических изображения поверхности материала. Левое изображение было создано ИИ, а правое изображение было получено с помощью микроскопа

Для этого исследователи использовали циклическую генеративно-состязательную сеть, или CycleGAN, которая может переносить стиль изображения из одного домена в другой без использования парных примеров.

Общая идея состязательных сетей основана на «соревновании» между двумя сетями: генератором и дискриминатором. Генератор пытается создать искусственные данные, которые будут выглядеть как реальные, а дискриминатор пытается отличить эти искусственные данные от реальных. С течением времени обе сети становятся все лучше в своих задачах, что ведет к созданию искусственных данных высокого качества, практически неотличимые от реальных.

Благодаря обучению на небольшой выборке реальных микроскопических изображений, ИИ смог генерировать изображения, которые использовались для обучения аналитического алгоритма. Теперь учёные могут распознавать широкий спектр структурных особенностей материала, несмотря на фоновый шум и систематические несовершенства.

Важность исследования в том, что экспертам не пришлось заранее обучать ИИ распознавать фоновый шум или искажения изображения в микроскопе. Это значит, что даже если есть что-то, о чем учёные не думали, CycleGAN способен самостоятельно научиться этому и использовать в своей работе.

Исследовательская группа внедрила CycleGAN в свои эксперименты по обнаружению дефектов в двухмерных полупроводниках — классе материалов, простых для применения в электронике и оптике, но сложных для характеризации без помощи ИИ. Однако этот метод имеет гораздо более широкие возможности применения.

Учёные отметили, что с помощью технологии можно создать самоуправляемый (автономный) микроскоп. Однако для создания такого микроскопа самым большим препятствием было понимание, как обрабатывать данные, но проделанная работа экспертов решает эту проблему. По словам специалистов, они смогли показать, как можно научить микроскоп обнаруживать интересные вещи, не имея представления о том, что именно нужно искать.

Источник: securitylab