Характеризация материалов доказала свою эффективность как наиболее интуитивный подход к пониманию химического состава, структуры и микроструктуры материалов, что является основой проектирования материалов. Одним из важнейших этапов проектирования материалов является извлечение характеристик из изображения и установление их связи со структурой и свойствами материала.
Поэтому в последние годы, с быстрым развитием алгоритмов машинного зрения, характеризационные изображения привлекли внимание в области характеризации материалов. Исследователи используют алгоритмы компьютерного зрения, такие как шумоподавление и улучшение изображений, для предварительной обработки изображения-представления, сегментации и классификации изображений для обнаружения и разделения каждой микроструктуры на характерификационном изображении и количественного анализа свойств материалов.
В данной работе обобщены и обсуждены применения алгоритмов компьютерного зрения в представлении изображений материалов. Представлены последние и ценные взгляды для экспертов и ученых как в области компьютерного зрения, так и в области материаловедения. Таким образом, этот обзор служит руководством для исследования материалов и способствует развитию искусственного интеллекта в области материаловедения.
1. Введение
Состав, структура и морфология, определяющие физические и химические свойства материалов, обычно исследуются с помощью различных методов характеризации. К распространенным методам характеризации в области микроскопической визуализации относятся оптический микроскоп (ОМ), сканирующий электронный микроскоп (СЭМ), просвечивающий электронный микроскоп (ПЭМ), сканирующий просвечивающий электронный микроскоп (СТЭМ) и атомно-силовой микроскоп (АСМ).
ОМ использует визуализацию в видимом свете, разрешение которой находится на микрометровом уровне, а подготовка образцов быстрая и простая. [1–3] Электронные микроскопы используют визуализацию электронным пучком с более короткой длиной волны, и их разрешение может достигать нанометрового уровня.
Среди них, тонкая визуализация электронным пучком в СЭМ позволяет получить информацию о морфологии поверхности и составе образцов. [4, 5] Высокоэнергетический электронный пучок в ПЭМ позволяет даже получить информацию о кристаллической структуре и дефектах внутри образца . [6–9]
В последние годы новейшие разработки в области высокоточных технологий характеризации изображений, таких как АСМ и СТЭМ, позволяют наблюдать микроскопическую эволюцию материалов с атомным пространственным разрешением и субсекундным временным разрешением [5, 10-12] , что позволяет непосредственно наблюдать динамические явления на атомном уровне, включая эволюцию дефектов, миграцию дислокаций, фазовые превращения и т.д., и накапливать большой объем данных.
Хотя возможности получения данных о материалах с высоким пространственно-временным разрешением постоянно улучшаются, информации о динамике процессов и термодинамике, получаемой из этих высококачественных изображений, очень мало. Присущие ручному анализу ограничения по объему и скорости препятствуют глубокому использованию высокоточных технологий характеризации. Эти данные просто отбираются для качественных исследований, чисто ручной анализ затрудняет быстрое и точное получение всей информации с изображения, огромные объемы данных отбрасываются и тратятся впустую.
Например, на СТЭМ-снимке могут быть десятки тысяч атомов, но лишь немногие из них выбраны для количественного изучения состава и структуры расположения. [13] Из-за наличия инструментального шума и артефактов изображения, связанных с движением атомов, ручной анализ высокопроизводительных и больших объемов микроскопических данных затруднен.
Во-первых, требуется много внимания, чтобы вручную определить точные морфологические характеристики и распределение отдельного наноматериала, идентифицировать все частицы и отслеживать их траектории для изучения динамики. Во-вторых, при ручном анализе легко упустить важную информацию. Например, неэффективно идентифицировать перекрывающиеся или смежные изображения наночастиц или анализировать изображения STEM с неоднородными тенями от пропускания электронного пучка.
Как видно, для успешной характеризации материалов в материаловедении необходимы не только поисковые исследования и усовершенствование приборов, но и своевременная и эффективная обработка высокопроизводительных данных, генерируемых этими приборами, для получения специфической информации, такой как динамика и термодинамика, описывающие микроструктуру материалов. Обработанная информация впоследствии используется в качестве обратной связи для планирования эксперимента и оптимизации свойств. Поэтому крайне важно разработать визуальную модель для изображения характеризации материалов, заменяющую ручной и автоматический анализ этого изображения.
Возможности машинного обучения по обработке многомерных данных открывают новые перспективы для изображений, полученных с помощью электронного микроскопа. Некоторые исследователи создали наборы данных изображений для характеризации материалов, собрав и разметив данные микроскопических изображений. Для идентификации и локализации атомных или кристаллических дефектов были разработаны модели нейронных сетей и динамические статистические модели на основе глубокого обучения (DL). Например, автоматически определялось расстояние между кристаллами, классифицировалась и подсчитывалась реальная морфология микрочастиц, проводился количественный анализ динамики тканей материалов, а также осуществлялся автоматический высокопроизводительный анализ изображений, характеризующих материалы. Таким образом, технология анализа микроскопических изображений материалов на основе машинного зрения стала актуальной областью исследований в сфере характеризации.
Таким образом, в данной статье обобщаются последние достижения в области визуальных алгоритмов и методов анализа, используемых при анализе изображений характеристик материалов за последние годы, систематизируются технологии автоматического анализа различных микрохарактеристик изображений в разных масштабах, подтверждаются проблемы, существующие в современных визуальных моделях характеристики материалов, и указываются будущие направления развития технологий обработки микроизображений материалов. В следующей части будут представлены некоторые широко используемые алгоритмы и модели в области обработки изображений материалов.
2. Ключевые технологии и новейшие направления в компьютерном зрении
Компьютерное зрение обладает самой долгой историей исследований и наибольшим накоплением технологий в области искусственного интеллекта. В этом разделе рассматриваются ключевые технологии и последние направления исследований в области машинного зрения на трех уровнях обработки изображений: обработка изображений, анализ изображений и понимание изображений, показанные на рисунке 1. В частности, мы обобщаем и сравниваем наиболее часто используемые модели машинного зрения: сверточную нейронную сеть (CNN), полносверточную сеть (FCN), U-net, генеративно-состязательную сеть (GAN) и вариационный автокодировщик (VAE) (таблица 1), чтобы установить связь с обработкой изображений, характеризующих материалы, в надежде предоставить методику для характеризации материалов и найти новые направления исследований.

Рисунок 1. В компьютерном зрении три уровня обработки данных: а) Предварительная обработка изображений подготавливает данные для работы моделей. б) Анализ изображений направлен на извлечение признаков для целевых задач. в) Понимание изображений устраняет разрыв между содержанием изображения и его лингвистическим значением.
| Модели | Преимущества | Недостатки |
|---|---|---|
| модели извлечения признаков | ||
| CNN | 1. Легко работать с многомерными данными. | 1. Потеря ценной информации и игнорирование взаимосвязи между локальным и целостным контекстом. |
| 2. Автоматическое извлечение признаков | 2. Результаты обучения могут сходиться к локальному минимуму; | |
| 3. Сетевой уровень не должен быть слишком глубоким. | ||
| FCN | 1. Соединение типа «скачок» объединяет глубокую грубую информацию с поверхностной тонкой информацией. | 1. Результат недостаточно точен. |
| 2. Отсутствие пространственной согласованности | ||
| U-net | 1. Передайте контекстную информацию на более высокий уровень детализации. | 1. Невозможно работать с изображениями, имеющими несколько масштабов. |
| 2. Распространяйте только эффективную часть каждого сверточного слоя. | ||
| Модели поколений | ||
| GAN | 1. Создайте реалистичное изображение с деталями. | 1. Сложно тренировать |
| 2. Обучающие данные могут быть без аннотаций. | 2. Модель слишком свободна в управлении. | |
| 3. Избавьтесь от повторяющихся примеров задач. | ||
| VAE | 1. Было проведено непосредственное сравнение восстановленного изображения и исходного изображения. | 1. Полученное изображение размыто. |
| 2. Обучающие данные могут быть без аннотаций. | ||
| Оптимизация моделей | ||
| Причины | Решения | |
| Подгонка | 1. Простая модель | 1. Добавить функциональные элементы. |
| 2. Внедрение экспертных знаний | ||
| Переобучение | 1. Небольшие наборы данных | 1.1 Делайте больше фотографий |
| 2. Сложная модель | 1.2 Расширение данных | |
| 2.1 Регуляризация весов | ||
| 2.2 Удалите несколько нейронов | ||
| 2.3 Пакетная нормализация | ||
2.1 Предварительная обработка изображений
В основе компьютерного зрения лежит предварительная обработка изображений, в основном включающая шумоподавление и улучшение качества изображения, а также увеличение объема данных. GAN шумоподавление, и увеличение объема данных могут быть рассмотрены перед обучением моделей для получения желаемых результатов.
Из-за электромагнитных помех, дрожания объектива и высокоскоростного движения объектов в кадре изображения часто содержат «соль и перец», гауссовский шум, низкий контраст и проблемы размытия. Поэтому необходимо шумоподавление и улучшение изображения [14–16] для повышения качества изображения и уменьшения сложности последующего анализа и понимания изображения (рис. 1а ). В последнее время, с появлением смартфонов для ночной съемки, шумоподавление изображений при слабом освещении [17–19] стало актуальной задачей, особенно для темных изображений.
Кроме того, расширение данных рассматривается как способ решения проблем, вызванных недостатком данных. Одна из мощных сетей для расширения данных называется общей состязательной сетью (GAN). Большинство исследователей модифицируют структуру GAN с помощью различных сетевых архитектур, функций потерь и эволюционных методов. [20–22] Модели хорошо разработаны для удовлетворения потребностей пользователей в изменении макияжа и стиля в один клик в таких приложениях, как TikTok и Photoshop.
2.2 Анализ изображений
Цель анализа изображений (рис. 1b ), необходимого для понимания изображений, заключается в том, чтобы машина или компьютер автоматически анализировали скрытые особенности и верхнюю структуру. Одной из ключевых технологий анализа изображений является сегментация изображений, которая подразумевает извлечение значимых признаков из изображения, включая края и области объекта на изображении. Алгоритм компьютерного зрения (CV) классифицирует семантику каждой области, всегда достигая более точных и эффективных результатов сегментации. [23–27] Новаторским достижением стал механизм внимания [28–32], позволяющий машине избирательно обрабатывать признаки. Другие фокусируются на реальных характеристиках изображения, включая экспозицию, контраст, освещение, форму объекта и текстуру поверхности [33, 34], чтобы решить проблему ошибок сегментации , вызванных различиями между синтетическими данными и изображениями реального мира.
2.3 Понимание изображений
Понимание изображений на основе анализа изображений предполагает дальнейшие исследования не только объектов, но и взаимосвязей между ними, что позволяет передавать практическое значение с помощью естественного языка (рис. 1c). Опираясь на нейронные сети, понимание изображений проводит высокоуровневые исследования по объединению изображений, визуальной информации, естественного языка и других типов сигналов, связывая разрозненные области пикселей с лингвистическим смыслом, чтобы компьютерная система могла автоматически понимать семантическую информацию в изображении. В настоящее время исследования в области понимания изображений в основном сосредоточены на обнаружении объектов и 3D-реконструкции.
Обнаружение объектов выявляет все интересующие объекты на изображении, как правило, включая местоположение и классификацию целей. Основные технологии обнаружения объектов обычно делятся на две категории: двухэтапное обнаружение, при котором сначала определяются области-кандидаты, содержащие общую информацию о местоположении цели, а затем классифицируются и уточняются области-кандидаты. [27, 35, 36] Другой вариант — одноэтапное обнаружение, при котором непосредственно генерируются вероятность и координаты категорий объектов. [37-39]
Кроме того, 3D-реконструкция помогает компьютеру понять глобальную информацию об окружающей среде и достичь реального восприятия окружающей среды. Технология 3D-реконструкции использует взаимосвязь между системой координат изображения и мировой системой координат для реконструкции 3D-информации с использованием информации из множества 2D-изображений, чтобы получить 3D-информацию об объектах в окружающей среде. В зависимости от различных форм обработки данных, ее можно разделить на методы, основанные на вокселях [40] , на облаке точек [41-43] и на сетке [44-46] .
2.4 Модели компьютерного зрения для микроскопии
Свертка — это основная операция в моделях машинного зрения. По сути, каждое изображение может быть представлено в виде матрицы значений пикселей, где канал представляет собой некоторую композицию изображения, например, красный, зеленый и синий каналы изображения. Операция свертки использует сверточные ядра (матрицы) разных размеров для скольжения по изображению и вычисления произведения соответствующих элементов, тем самым извлекая признаки изображения и сохраняя взаимосвязь между пикселями. Веса каждого сверточного ядра непрерывно обновляются в процессе обучения для поиска наиболее согласованного отображения вход-выход.
CNN [47] — один из наиболее представительных алгоритмов компьютерного зрения благодаря своей превосходной способности извлекать информацию. CNN построен на основе ряда сверточных, нелинейных, сходящихся (понижающих) и полносвязных слоев. Изображение проходит через сверточные и нелинейные слои для получения карт признаков, а понижение разрешения позволяет изменять размер изображения в соответствии с различными требованиями, такими как классификация и сегментация. Пониженные карты признаков в конечном итоге подаются на полносвязные слои для получения вероятности класса или класса, который наилучшим образом описывает изображение.
FCN [48] и U-net [23], обе являющиеся производными от CNN, корректируют свои структуры для балансировки характеристик нескольких масштабов. FCN заменяет последние полносвязанные слои базовой сети на полносверточные слои. Таким образом, входы и выходы сети могут представлять собой изображения любого размера. В то же время используется структура скачкообразных соединений для объединения грубой градуированной информации с мелкозернистой информацией для получения точной и качественной сегментации. Но результат сегментации недостаточно точен. Другая замечательная сеть, U-net, связывает полностью симметричные слои кодировщика и декодера с помощью скачкообразных соединений. По сравнению с FCN, в ней добавлено большое количество каналов и скачкообразных соединений, что позволяет сети распространять контекстную информацию с более высоким разрешением и предотвращает потерю важной информации при уменьшении разрешения изображения. Они достигают больших успехов в анализе и сегментации материальных изображений.
В отличие от предыдущих случаев, генеративные модели в основном состоят из двух сетей, отвечающих за создание изображений, отличающихся от исходных данных, таких как GAN [49] и VAE [50]. GAN состоит из генератора и дискриминатора. Генератор используется для генерации изображений, похожих на реальные изображения, чтобы обмануть дискриминатор. В то время как дискриминатор, как классификатор, обучается различать сгенерированное изображение от реального. Во время обучения используется градиентный спуск для попеременной оптимизации D и G.
Благодаря столкновению между ними, когда модель генерации может восстановить распределение обучающего набора данных, а дискриминатор не может отличить исходное изображение от реального, сеть может сгенерировать большое количество изображений, достаточное для того, чтобы спутать реальное изображение с ложным.
Другая модель, VAE, использует две нейронные сети для создания двух моделей распределения вероятностей: сеть вывода выводит потенциальные признаки исходного входного изображения и генерирует вариационное распределение вероятностей скрытых переменных, которое называется потенциальным пространством. На основе сгенерированного вариационного распределения вероятностей скрытых переменных, созданная сеть отбирает изображения из потенциального пространства и восстанавливает приблизительное распределение вероятностей исходных данных.
Модели, обладающие способностью к обобщению, могут страдать от проблем недообучения или переобучения. Недообучение плохо отражает характеристики данных, ограниченное простой структурой модели. Эти проблемы можно решить путем введения признаков и экспертных знаний, например, путем повышения определенных весов.
Переобучение, еще одна неприятная проблема, не может успешно представлять другие данные, кроме обучающей выборки, из-за ограниченного количества наборов данных и сложных моделей. Проблемы с данными обычно проявляются в небольших наборах данных, где у модели недостаточно данных для обучения, чтобы уловить распределение и закономерности реальных данных.
В таких обстоятельствах аугментация данных становится ценным решением, как обсуждалось в разделе 2.1. Аналогично, для решения проблемы с моделью нам нужны некоторые советы по ее настройке, чтобы модель могла находить соответствие не только для обучающей выборки. Регуляризация весов и случайное удаление некоторых нейронов могут сделать не все веса необходимыми, что увеличивает сложность обучения модели.
Кроме того, стандартизация пакетов делает входные данные следующего слоя близкими к гауссовому распределению, чтобы избежать смещений, вызванных текущими входными данными. Указанные методы позволяют в определенной степени скорректировать обобщающую способность модели.
Кроме того, существует множество различий между микроскопическими изображениями и традиционными визуальными изображениями, таких как тип шума, количество каналов и извлекаемая информация. Для более эффективного применения этих моделей в области материаловедения необходимо понимать принцип формирования изображений и особенности изображений в этой области.
С одной стороны, использование характеристик предметной области в качестве входных данных для априорных знаний может значительно повысить точность модели, с другой стороны, это способствует направленному анализу характеристик для руководства проектированием и проверкой характеристик новых материалов. Более того, это может помочь раскрыть секрет «черного ящика» модели.
3. Приборы для визуализации и система, основанная на машинном зрении.
Внутренние компоненты, структура и морфология, определяющие физические и химические свойства материалов, обычно исследуются с помощью различных методов характеризации. Благодаря новейшим разработкам в области микроскопии, человек начинает наблюдать структуру материалов с атомным пространственным разрешением и субсекундным временным разрешением. В данном обзоре мы рассматриваем последние публикации по применению оптической микроскопии (ОМ), атомно-силовой микроскопии (АСМ), просвечивающей электронной микроскопии (ПЭМ) и сканирующей просвечивающей электронной микроскопии (СПЭМ) в области визуализации материалов. Понимание принципа микроскопической визуализации помогает нам в работе с информацией, получаемой при извлечении изображений.
3.1 Визуализационные приборы
Оптическая система ОМ использует видимый свет и коэффициент линзы для увеличения и получения изображений мельчайших объектов. [1–3] Объект проходит через объектив, образуя увеличенное действительное изображение, а затем проходит через окуляр, образуя увеличенное мнимое изображение. ОМ позволяет наблюдать выбранные поперечные сечения прозрачных материалов без разрезания образцов.
Например, в биологии биологическую активность можно наблюдать, отслеживая флуоресценцию специфических атомных или молекулярных маркеров. Это позволяет проводить наблюдения в реальном времени и в динамическом режиме, и занимает доминирующее положение в биологии. [2, 3] Однако дифракционный предел ОМ ограничен увеличением в 1000 раз и разрешением в 200 нм.
АСМ, состоящий из зонда, чувствительного к слабым силам, сканирует образец за счет взаимодействия атомов на поверхности образца и атомов на кончике зонда. [10, 11, 51] Таким образом, можно измерить изменения положения каждой точки сканирования микрокантилевера и получить информацию о морфологии поверхности образца с нанометровым разрешением. АСМ имеет три очевидных преимущества.
Во-первых, АСМ может обеспечить реальный трехмерный профиль поверхности. [10] АСМ может визуализировать практически любую поверхность объекта, предоставляя качественную и количественную информацию о физических свойствах и статистическую информацию. [11] Во-вторых, АСМ не требует предварительной обработки образца, например, нанесения проводящей пленки, для предотвращения необратимых повреждений. В-третьих, он может работать при нормальном давлении или даже в жидкой среде, [51] что открывает возможности для изучения биологических макромолекул или живых биологических тканей. Однако АСМ чувствителен к зонду, что приводит к низкой скорости визуализации и малому диапазону.
В просвечивающем электронном микроскопе (ПЭМ) в качестве источника освещения используется электронный пучок с очень короткой длиной волны, а для фокусировки изображения применяется электромагнитное перспективное зеркало, которое используется для анализа образцов микро- и наноразмера. [6–9] ПЭМ передает ускоренный и сфокусированный электронный пучок на очень тонкий образец, где он сталкивается с атомами в образце, вызывая рассеяние.
Яркость полученного изображения зависит от атомного номера, кристаллической структуры, электронной плотности и толщины образца. ПЭМ обладает сильной способностью к рассеянию, поэтому он позволяет обрабатывать микро- и нанообласти и изучать структурный состав. [6, 7] Он обладает высоким разрешением и позволяет непосредственно наблюдать изображение атомов тяжелых металлов. [8]
Кроме того, изображения в светлом и темном поле полезны для анализа структурных дефектов, и с их помощью можно получить информацию о фазе. [9] Основными недостатками ПЭМ являются высокая точность и высокая стоимость прибора, сложный процесс изготовления образца и необходимость получения изображений в вакууме.
СЭМ использует физические сигналы, такие как изображения вторичных электронов и обратнорассеянных электронов, для наблюдения морфологии поверхности и состава образца, а также структуры поверхности скола. [4, 5] Образец для СЭМ легко изготавливается без нарезки [4] и может вращаться в трехмерном пространстве, что способствует многоугловому наблюдению. [5] Однако из-за эффекта заряда и неравномерного отклонения электронного пучка, вызванного электростатическим полем, возникают неравномерная яркость и затемнение изображения, деформация изображения и дрейф изображения. Кроме того, неравномерный разряд заряженных образцов может вызывать яркие пятна и линии на изображении.
Сканирующий просвечивающий электронный микроскоп (STEM) имеет приспособление для пропускания на сканирующем зеркале, что позволяет одновременно использовать функции сканирования и пропускания, и получать внутреннюю структуру материала. По сравнению с TEM, STEM имеет более низкое ускоряющее напряжение, что значительно снижает повреждение образца электронным пучком и улучшает контрастность изображения. Он подходит для микроструктурной характеристики органических полимеров, биологических и других мягких материалов. [12] Во-вторых, STEM может одновременно генерировать сканирующее изображение вторичных электронов и изображение пропускания, что позволяет получать информацию о морфологии поверхности и внутренней структуре в одном и том же месте. [52] Технология STEM очень требовательна и требует чрезвычайно жесткой вакуумной среды.
Хотя эти инструменты отражают различные свойства материалов, такие как масштаб, морфология, структура и состав, из-за различных принципов визуализации у них есть некоторые общие проблемы. Во-первых, сложно быстро получить информацию о конкретном материале из изображений. Скорость и полнота информации имеют решающее значение при накоплении больших объемов данных. Вторая проблема — точность извлечения информации, ограниченная шумом, технологией подготовки образцов и неизбежным повреждением приборов. Третья проблема — невозможность решения многомерных задач, таких как перекрытие частиц, только с помощью человеческих ресурсов.
Четвертая, но не последняя, — как реконструировать новые материалы и прогнозировать их характеристики. Однако алгоритмы компьютерного зрения проливают свет на эти проблемы. Мы надеемся найти универсальный процесс, основанный на идеалах в области компьютерного зрения, который позволит извлекать информацию из любого микроснимка, даже если материалы находятся в разных физических системах.
3.2 Структура, основанная на визуальном восприятии
Используя преимущества алгоритмов машинного зрения, мы разработали структуру глубокого обучения для обработки изображений, характеризующих материалы, которая может быть использована для реализации исследований микроизображений в материаловении на основе машинного зрения. Она состоит из пяти частей: анализ задачи, подготовка данных, проектирование модели и анализ результатов (рис. 2).

Рисунок 2. Общая блок-схема анализа микроскопических изображений на основе компьютерного зрения.
Анализ задачи предполагает разделение задачи на категории классификации или регрессии, а данные, собранные от людей или в ходе моделирования, должны быть подготовлены перед подачей в модель, например, путем шумоподавления, разметки и разделения на обучающие/тестовые/валидационные наборы данных. Третий шаг — разработка модели в соответствии с типом задачи и характеристиками данных. Разработка модели имеет важное значение на протяжении всей задачи, учитывая функции и прогнозируемые результаты.
Например, сети FCN, U-net и Visual Geometry Group (VGG) подходят для извлечения признаков, тогда как GAN и VAE используются для генерации. Следующий шаг, анализ результатов, помогает разработчикам найти связь между скрытой структурой и свойствами и оценить качество сети. Последний шаг — валидация результатов, которая позволяет выявить возможные новые структуры и свойства.
4. Компьютерное зрение в микроскопии
Системы компьютерного зрения предоставляют эффективный и точный автоматический способ микроскопической характеризации материалов, что подтверждено во многих областях. Алгоритмы используются для создания наборов данных для моделирования микроскопических изображений, обнаружения дефектов, анализа морфологических особенностей, исследования состава и проектирования материалов. В данной работе мы указываем на конкретные проблемы в каждой задаче характеризации материалов, а также предлагаем ключевые решения на основе компьютерного зрения для целевых технологий характеризации материалов, применяемых в последние годы.
4.1 Создание набора данных для моделирования
В традиционной задаче компьютерного проектирования материалов стоимость сбора реальных данных очень высока. Мы можем иметь лишь ограниченное количество образцов микроструктуры и свойств материала, например, из-за использования стержня, ТЭМ и других методов электронной микроскопии, высокой стоимости и сложного процесса подготовки образцов. Кроме того, расчеты моделирования, такие как расчеты DFT, включают в себя множество приближений и функций, связанных с обменом [53], и их результаты необходимо проверять другими тестами.
Для крупномасштабных систем с несколькими временными масштабами и неупорядоченными структурами вычисления будут слишком ресурсоемкими, а стоимость вычислений обычно слишком высока. Однако в последние годы любое количество образцов материалов может быть сгенерировано путем объединения машинного зрения с созданием наборов данных моделирования материалов с незначительными вычислительными затратами. Как ветвь сетей машинного зрения, генерация GAN и VAE имеет большой потенциал. Алгоритм легко генерирует большое количество данных моделирования, сохраняя при этом разумную точность для изучения распределения формы реальных образцов.
Например, Ма и др. сгенерировали большое количество оптических изображений поликристаллического железа на основе модели GAN для сегментации зерен. [54] Генератор состоит из сети U-net с кодированием и декодированием, которая используется для захвата небольшого шума реальных данных в ходе фактического тестирования. Затем модель передачи изображения смешивает реалистичные особенности с моделируемым изображением и, наконец, получает составное изображение.
Лю и др. использовали сеть DCGAN для генерации диаграммы постоянной температуры для неразрушающего контроля [55] ( рис. 3а ) . Размер сети DCGAN может быть скорректирован в соответствии с исходной картой постоянной температуры, а CNN используется для замены многослойного зондирования в исходной GAN. Сеть DCGAN обучается на большом объеме информации из тепловых изображений, а сгенерированные высокоразмерные изображения компенсируют недостаток тепловых изображений в импульсной тепловизионной съемке и в определенной степени устраняют шум.
Фактически, VAE также выполняет аналогичную функцию, выступая в качестве генератора. Цан и др. использовали метод без учителя, основанный на VAE, для извлечения скрытых признаков из гетерогенных сплавов и генерации морфологических ограничений изображений [56] (рис. 3b). По сравнению с моделью марковского случайного поля, свойства материала моделируемых образцов лучше соответствуют реальным образцам. Мамун и др. использовали модель генерации VAE для создания синтетических образцов сплавов, что помогло моделям сделать надежное прогнозирование ресурса ползучести и способствовало обратному проектированию сплавов.

Рисунок 3. Создание набора данных для моделирования с помощью компьютерного зрения. а) Структура DCGAN используется для генерации изотермических карт для неразрушающего контроля. Она компенсирует недостаточную импульсную тепловизионную съемку и снижает шум. Адаптировано с разрешения. [55] Авторское право 2021, IOPscience. б) Сеть на основе VAE демонстрирует более высокое качество генерируемого изображения по сравнению с моделью случайного поля Маркова. Адаптировано с разрешения. [56]
4.2 Сегментация зерна и текстуры
Применение алгоритма сегментации изображений к микроскопическим снимкам демонстрирует большой потенциал, значительно улучшая сегментацию границ зерен, обнаружение и подсчет частиц, а также способствуя распознаванию микроструктуры материалов и морфологическим исследованиям.
Хотя традиционная пороговая сегментация позволяет различать передний и задний план большого количества изображений, высокое разрешение микроснимков приводит к сложной структуре данных, загрязнениям, образующимся в процессе подготовки образцов, и изменчивости микроструктуры образцов материалов, что создает серьезные проблемы для задачи сегментации изображений на микроснимках. Благодаря задачам компьютерного зрения, проблема сегментации трансформируется в задачу классификации, что позволяет смягчить вышеупомянутые проблемы, которые не могут быть решены традиционными методами.
В гораздо более частых случаях один из срезов микроскопического изображения может иметь разрешение 3200 × 3200 [57] , что может быть слишком большим для ограниченного обучения на GPU. В большинстве статей для сжатия размера изображения используется пулинг.
Пулинг — это нелинейное уменьшение разрешения, и это также наиболее распространенная структура в нейронных сетях. Пулинг использует максимальное или среднее значение для каждой подобласти входных данных, чтобы уменьшить разрешение и сохранить наиболее важную информацию изображения. Кроме того, некоторые исследователи обрезают фотографии [13, 58] и расширяют набор данных сегментации, решая при этом проблему слишком больших изображений. Максов и др. использовали только первый кадр пленки для завершения обучения сети и сегментировали дефекты на изображении Mo, смешанного с WS2 (рис. 4а) [13] .

Рисунок 4. Сегментация зерен и текстур с помощью компьютерного зрения. а) Сеть на основе кодирования-декодирования для обнаружения дефектов, нарушающих периодичность решетки. Использовался только первый кадр, разделенный на несколько частей для обучения модели, чтобы избежать проблем с разрешением. Адаптировано с разрешения. [13] Авторское право 2019, Springer Nature. б) Архитектура FCN демонстрирует мощные возможности в задачах сегментации и отлично справилась с классификацией изображений низкоуглеродистой стали, полученных с помощью СЭМ. Адаптировано с разрешения. [58] Авторское право 2019, Springer Nature. в) Неконтролируемое обучение, алгоритм, который недавно привлек внимание, позволяет избежать искусственной маркировки и сегментации поверхностных дефектов. Адаптировано с разрешения. [64]
Эксперты вручную отмечают на изображении объекты, которые необходимо сегментировать, и подают данные в обучающую нейронную сеть, что позволяет значительно избежать проблем с сегментацией, вызванных загрязнением образца, и подходит для любого материала. Наиболее часто используемые сети — это FCN и U-net, основанные на кодировщиках-декодерах. FCN используется для анализа распределения углеродных волокон в цементном композите, улучшая электрические свойства CFRC. [59]
Азими и др. добавили схему голосования по максимуму к FCN для классификации изображений SEM низкоуглеродистой стали (рис. 4b ). [58] U-net также успешно используется в области материаловедения, например, для сегментации атомов и сегментации текстур. [60–63]
Чен и др. разработали самонастраивающуюся полуконтролируемую структуру с предсказанием псевдометок на основе U-net. [61] Используя как маркированные, так и немаркированные модели обучения металлических изображений, можно получить хорошие результаты распознавания микроструктуры с небольшим количеством маркированных изображений. Аналогичные работы также использовались для обнаружения дефектов в армированных углеродным волокном пластиках [62] и анализа состава металлографических изображений [63] .
Высококачественная разметка изображений требует много времени и человеческих ресурсов. Для задач сегментации исследователи стараются избегать ручной разметки. Например, Мэй и др. использовали метод обучения без учителя для обучения на образцах без дефектов, чтобы реализовать автоматическую сегментацию дефектов текстурной поверхности (рис. 4c ). [64]
Чжао и др. также обучали только образцы без дефектов и использовали сеть GAN для реконструкции изображений дефектов. [65] Затем извлекаются признаки реконструированного изображения и исходного изображения, и часть с большой разницей в признаках может точно определить местоположение дефекта. Максов и др. использовали периодичность расположения атомов и преобразование Фурье для автоматического определения местоположения дефекта, которое использовалось в качестве эталонных данных для обучения сети. [13]
4.3 Отслеживание частиц
Алгоритмы машинного зрения предоставляют важную точку зрения для технологии отслеживания частиц. Поскольку состав и движение частиц оказывают большое влияние на их функционирование, быстрая и точная технология отслеживания частиц имеет большое значение. Традиционные технологии отслеживания частиц очень сложны. Из-за жесткого соотношения сигнал-шум, фиксированного размера и количества частиц [66] и сложного алгоритма диффузии возникает риск получения худших результатов отслеживания. В этой области алгоритмы машинного зрения в сочетании с использованием наборов смоделированных данных могут эффективно преодолеть эти ограничения.
Зиатдинов и др. доказали, что обработка изображений может уменьшить шум на изображении (рис. 5а) . [60] Они используют сверточную нейронную сеть на основе архитектуры U-net, чтобы избежать регионального загрязнения и точно определить тип и местоположение атомов. После этого, изучив вызванное пучком перемещение атомов кремния на краю графена и вес графена, был завершен всесторонний анализ обратимого процесса, вызванного электронным пучком. Позже Зиатдинов дополнительно объединил глубокое обучение с гибридным моделированием, успешно преобразовал зависящие от времени координаты и направления поверхности частиц на фотографиях АСМ с инструментальным шумом и артефактами [67] и изучил динамический процесс самосборки белков на неорганических поверхностях и образующиеся структуры.

Рисунок 5. Отслеживание частиц с помощью компьютерного зрения. а) Полносверточная нейронная сеть на основе архитектуры U-net позволяет избежать регионального загрязнения и точно определять тип и отслеживать местоположение атомов. Адаптировано с разрешения. [60] Авторское право 2019, Wiley. б) Введение радиального расстояния между частицей и центром изображения в сети, состоящие из сверточных и плотных слоев, повышает точность отслеживания частиц. Адаптировано с разрешения. [ 68 ] Авторское право 2019, Оптическое общество Америки. в) Сеть кодировщик-декодер декодирует информацию о глубине для решения задач перекрывающихся частиц в пространстве. Адаптировано с разрешения. [ 71 ] Авторское право 2019, Springer Nature.
Алгоритм на основе глубокого обучения значительно повышает точность позиционирования. [68, 69] Хельгадоттир и др. реализовали точное отслеживание многочастичных и несферических тел в условиях нестабильного источника света (рис. 5b). [68] Сеть состоит из трех сверточных слоев и двух плотных слоев. Введение радиального расстояния между частицей и центром изображения значительно повышает точность распознавания изображения без частиц. Мидтведт и др. применили взвешенную усредненную сверточную нейронную сеть к голографическому изображению одного иона. [69] Не зная физических и химических свойств среды, мы можем индексировать преломление одной субволновой частицы, используя всего два порядка величины меньше, чем стандартный метод.
Атомное отслеживание также используется в 3D-пространстве. Например, Ньюби и др. реализовали отслеживание частиц в 3D-пространстве, имитируя, как объекты, движущиеся в 3D-пространстве, отображаются в 2D-пространстве. [70]
Для решения проблемы перекрытия частиц в пространстве Франчини и др. использовали сеть кодировщик-декодер для декодирования информации о глубине частиц (рис. 5c ). [71] В этой статье создан полусинтетический набор данных, который связывает изображение частицы с ее 3D-положением, включая все тонкие различия в форме частицы и сферические искажения, которые могут возникать в процессе движения. Благодаря обучению, даже если две частицы имеют одинаковое центральное положение, их все равно можно обнаружить. В то же время отмечается, что диапазон обнаруживаемой глубины изображения частицы может быть увеличен на 67% по сравнению с традиционным пороговым методом.
Более того, DL также используется для количественной оценки характеристик броуновского движения наночастиц на изображениях микроскопии поверхностного плазменного резонанса [72], отслеживания мелких и плотных частиц [73], отслеживания отдельной частицы в жидкостной ячейке просвечивающей электронной микроскопии (LCTEM) [74] и прогнозирования движения частиц [75, 76].
4.4 Структурная реконструкция
Реконструкция, как дополнение к средствам представления, обеспечивает морфологические особенности на разных масштабах глубины и содержит количественную структурную и функциональную информацию о пространственном распределении. В большинстве материальных систем соответствующая микроструктура отражает определенную степень случайности, например, распределение частиц по размерам, плотность числа частиц или площадь поверхности.
Однако эти характеристики должны быть статистическими. Цель реконструкции состоит в создании новых микроструктур в соответствии со статистическими характеристиками входных микроструктур, чтобы увеличить объем существующих данных изображений и даже направлять разработку будущих экспериментов по визуализации, например, определять необходимый масштаб и разрешение изображения. Машинное зрение помогает в реконструкции с двух точек зрения: скорость и гибкость. Общие этапы делятся на: 1) уменьшение размерности изображений сложных микроструктур; 2) получение характеристической информации о каждой микроструктуре для повышения точности реконструкции; 3) сквозная реконструкция.
Одним из преимуществ нейронных сетей является уменьшение размерности, позволяющее извлекать скрытые признаки низкоразмерных анизотропных микроснимков из многомасштабных и высокоразмерных 3D-структур, а затем восстанавливать более точную микроструктуру в соответствии с извлеченными признаками, например, сеть VAE. Ким и др. использовали сеть VAE для генерации более непрерывных изображений микроструктуры на основе 4000 изображений микроструктуры двухфазных сталей для исследования микроструктуры при оптимальных механических свойствах (рис. 6а) . [77]
Выход сети VAE используется для изучения моделирования и исследования взаимосвязи между структурой и атрибутами. Наконец, регрессия гауссовских процессов используется для связи потенциальных пустых точек и размера частиц феррита с механической энергией. Жирар и др. создали структуру, объединяющую векторное квантование VAE с гистограммой для классификации предварительно взорванных ядерных материалов и мелкозернистых параметров процесса. [78] Кодировщик квантует входное 3D-изображение с помощью гистограммы и кодирует его в 1D-карту признаков, которая называется вектором признаков, в то время как декодер восстанавливает исходное изображение с помощью вектора признаков. Векторы признаков, полученные из индексной гистограммы, могут дать новую идею для количественного анализа изображений микроструктуры.

Рисунок 6. Структурная реконструкция с помощью компьютерного зрения. а) VAE предоставляет способ уменьшения размерности. Адаптировано с разрешения. [77] Авторское право 2021, Elsevier. б) GAN — это стратегия, которая генерирует 3D-структуры с небольшим количеством наборов данных с чрезвычайно высокой скоростью. Адаптировано с разрешения. [80] Авторское право 2019, Elsevier. в) Перенос обучения — это еще один подход при работе с небольшими данными, демонстрирующий гибкость модели компьютерного зрения. Адаптировано с разрешения. [81] Авторское право 2020, Elsevier.
Еще одно важное преимущество внедрения нейронной сети в стохастическую реконструкцию заключается в скорости генерации 3D-структур. Среди них наиболее распространенной моделью генерации является GAN. GAN может использовать небольшое количество образцов для генерации реалистичных 3D-структур разных масштабов, избегая крупномасштабных процессов сбора данных с высокой скоростью.
Фэн и др. создали сетевую структуру на основе Bicycle GAN, которая отображает одно 2D-изображение на различные 3D-изображения пористых сред с гауссовым шумом. [79] Bicycle GAN состоит из трех частей: генератора G, дискриминатора D и кодировщика E. G получает 2D-изображения срезов и случайный шум и генерирует соответствующую 3D-структуру, D различает истинное и ложное значение входной 3D-структуры, а E кодирует полученную 3D-структуру в распределение.
Обучающий набор состоит из пар 2D-срезов и 3D-структур, в которых 2D-изображение представляет собой нижний срез 3D-структуры. После обучения модели и подачи на вход нового 2D-изображения преобразование 3D-структуры может быть выполнено на обычном ЦП, что занимает всего 1 с по сравнению с 10 ч при классическом методе.
Вальсекки и др. также разработали метод 2D-3D реконструкции для пористого песчаника (рис. 6b ). [80] Разница заключается в том, что разработанный автором GAN-сеть различает 2D-изображения. Используя аналогичную идею микрокомпьютерной томографии, алгоритм случайным образом извлекает группу 2D-срезов из 3D-структуры, сгенерированной генератором, подает на вход дискриминатор и оценивает качество реконструированной структуры, проверяя поперечное сечение реконструированной структуры, чтобы обучить сеть. Сгенерированная сетью 3D-структура также работает чрезвычайно быстро (20–30 мс).
Кроме того, широко используемый в машинном зрении метод, трансферное обучение, решает проблему недостатка данных в обучающем наборе микроструктуры конкретного материала при реконструкции. Трансферное обучение берет задачу в качестве модели предварительного обучения и применяет полученные знания и опыт к различным, но связанным задачам. С тех пор модель больше не ограничивается некоторыми типами материалов, а проходит через всю систему свойств микроструктуры, демонстрируя большую гибкость.
Бостанабад использует нейронную сеть глубины VGG-19 для предварительного обучения 2D-изображений с целью получения структурных признаков, таких как края и частицы (рис. 6c ). [81] С помощью целевых признаков сеть преобразует и оптимизирует размеры исходных стохастических 3D-изображений пакетами, так что уменьшенные признаки и признаки 2D-изображения находятся в одном и том же интервале распределения. Успешно реализована 3D-реконструкция микроструктур композитов, сплавов, пористых и поликристаллических материалов.
Предварительно обученная сеть VGG-19 также использовалась в исследовании Ли и др. для поиска трех статистически идентичных структур из микроструктуры любого материала. [82] Обучение может уменьшить разницу между целевой микроструктурой и исходной микроструктурой и сгенерировать реконструированную микроструктуру, аналогичную материалу маркера. Кроме того, автор пытается сократить миграционную сеть и выяснить влияние различных моделей на инициализацию сети.
5. Заключение
В данном обзоре мы обобщаем последние достижения в области машинного зрения и его применение в анализе изображений микроструктуры различных материалов. На основе большого количества опубликованных статей мы предлагаем комплексный процесс анализа микроскопических изображений с использованием машинного зрения, включающий анализ задачи, обработку данных, проектирование модели, анализ признаков и проверку результатов, что расширяет область применения машинного зрения в материаловедении.
Основные задачи машинного обучения сосредоточены на извлечении структуры материала [13, 64, 65], динамическом анализе [60, 67] и ускорении вычислений моделирования [55, 81]. Очевидные преимущества машинного зрения заключаются в его способности точно улавливать признаки, высокой обобщающей способности и высокой степени автоматизации.
Во-первых, изображение микроструктуры используется непосредственно в качестве входных данных без искусственной фильтрации, что делает модель на основе CNN перспективной для извлечения скрытой информации из большого количества пикселей.
Во-вторых, метод не ограничивается одной физической или математической моделью, трансферное обучение позволяет устанавливать связи между различными типами микроструктур, что может быть очень повторяющимся. Наконец, обученная модель может легко обрабатывать большие объемы многомерных данных и значительно сокращать трудозатраты. Кроме того, входное изображение микроструктуры может быть закодировано для получения многоканального представления (многомерных данных), что, как ожидается, позволит разделить несколько фаз материалов.
Помимо использования сверточного слоя, слоя пулинга и стека функций активации, в области компьютерного зрения были введены сетевые структуры, такие как графовая нейронная сеть (GNN) [83] и сеть долговременной кратковременной памяти (LSTM) [84] . Семантическая, временная и другая информация различных структур добавляется к извлечению признаков изображения, так что система зрения может объединять слух, текст и даже вкус для выполнения более точных задач классификации или регрессии. Этот метод также может быть использован в области материаловедения, например, для объединения результатов, полученных с помощью различных методов тестирования [85, 86].
Различные технологии анализа и тестирования имеют разные масштабы и дополнительную информацию. Чрезмерная зависимость от одного аналитического теста часто приводит к отсутствию объективного понимания законов материала и конфликтам с другими типами результатов тестирования. Поэтому анализ данных из нескольких источников одновременно может приблизить к сути внутренних законов материалов и сформировать всесторонние и эффективные результаты анализа для обратной связи с экспериментальным проектированием. Методы машинного обучения продемонстрировали широкие перспективы в области анализа данных, полученных методом слияния различных характеристик, что позволяет усилить взаимосвязь между технологиями визуального контроля и свойствами материалов.
Некоторые ученые-химики опасаются, что алгоритмы искусственного интеллекта, особенно глубокое обучение (DL), не могут обобщить физические или математические объективные законы на основе значений весов в наборе сетей. Они считают, что в процессе сопряжения определенных данных существуют совпадения, и будут наблюдаться различные сдвиги между тестовыми наборами данных и фактическими данными, но это не означает, что большинство алгоритмов DL приведут к таким предвзятым выводам.
Напротив, результаты, полученные на основе большого количества данных, могут быть более практичными для множества реальных областей. Факты доказывают, что по мере накопления объема данных DL становится полезным для точных прогнозов неизвестных входных данных в химии, таких как прогнозирование свойств материалов [87] , создание электронных носов [88] и оценка повреждения ДНК [89].
Более того, эксперты в различных областях используют DL в качестве инструмента, добавляя свои знания в предметной области для принятия решений, что позволяет избежать множества предвзятых выводов. Кроме того, некоторые так называемые отклонения могут пролить новый свет на некоторые проблемы и помочь исследователям переосмыслить их.
Использование инструментов компьютерного зрения для решения задач материаловедения станет неизбежной тенденцией в будущем, а это значит, что эксперты в области искусственного интеллекта и материаловедения должны работать вместе.
Предварительные знания, предоставляемые экспертами в области материаловедения, могут повысить точность результатов работы программы и стремиться найти интуитивно понятную связь между скрытыми признаками и параметрами материала, имеющими физический смысл [82], чтобы повысить интерпретируемость модели. Эксперты в области искусственного интеллекта могут разрабатывать более удобное программное обеспечение/платформу для экспертов в области материаловедения [63, 90], ориентированное на различные микроскопы и экспериментальные условия, сокращая время, затрачиваемое на искусственную статистику, и предоставляя руководство для исследования материалов, что действительно будет способствовать развитию материаловедения.
Литература
- Y. J. Shin, W. Shin, T. Taniguchi, K. Watanabe, P. Kim, S.-H. Bae, 2d Mater. 2021, 8, 035017.
- G. Tao, X. Xu, R. S. Li, F. Liu, N. Li, Acs Sensors 2021, 6, 1321.
- H. Zhou, C. Qin, S. Han, L. Zhang, R. Chen, G. Zhang, Y. Liu, Z. Wu, S. Li, L. Xiao, S. Jia, Nano Lett. 2021, 21, 1477.
- H. Roghani, S. A. Tayebifard, K. Kasraee, M. S. Asl, Ceram. Int. 2020, 46, 28922.
- X. Zhou, Z. Jia, A. Feng, K. Wang, X. Liu, L. Chen, H. Cao, G. Wu, Compos. Commun. 2020, 21, 100404.
- T. A. Saleh, Chem. Eng. J. 2021, 404, 126987.
- Z. Liu, Z. Zhang, Z. Wang, B. Jin, D. Li, J. Tao, R. Tang, J. J. De Yoreo, Proc. Natl. Acad. Sci. U. S. A. 2020, 117, 3397.
- M. R. Rosenberger, H.-J. Chuang, M. Phillips, V. P. Oleshko, K. M. Mccreary, S. V. Sivaram, C. S. Hellberg, B. T. Jonker, Acs Nano 2020, 14, 14240.
- Y. T. Chen, T. Zhang, W. Zhang, D. H. Ping, K. Hono, A. Inoue, T. Sakurai, Mater. Trans. 2002, 43, 2647.
- J.-H. Tzeng, C.-H. Weng, C.-C. Wang, M.-S. Ho, L.-T. Yen, J.-Y. Chen, G. Gaybullaev, C. Poonpakdee, Y.-T. Lin, Chem. Eng. J. 2021, 421, 127880.
- Q. Sun, W. Peng, X. Hai, Appl. Surf. Sci. 2021, 562, 149976.
- Y. Jiang, Z. Chen, Y. Hang, P. Deb, H. Gao, S. Xie, P. Purohit, M. W. Tate, J. Park, S. M. Gruner, V. Elser, D. A. Muller, Nature 2018, 559, 343.
- A. Maksov, O. Dyck, K. Wang, K. Xiao, D. B. Geohegan, B. G. Sumpter, R. K. Vasudevan, S. Jesse, S. V. Kalinin, M. Ziatdinov, npj Comput. Mater. 2019, 5.
- P. Liu, H. Zhang, K. Zhang, L. Lin, W. Zuo, in Proc. 2018 IEEE/CVF Conf. on Computer Vision and Pattern Recognition Workshops, IEEE, Piscataway, NJ 2018, pp. 886–895.
- K. Zhang, W. Zuo, Y. Chen, D. Meng, L. Zhang, IEEE Trans. Image Process. 2017, 26, 3142.
- K. Zhang, W. Zuo, L. Zhang, IEEE Trans. Image Process. 2018, 27, 4608.
- C. Guo, C. Li, J. Guo, C. C. Loy, J. Hou, S. Kwong, R. Cong, in 2020 IEEE/CVF Conf. on Computer Vision and Pattern Recognition, IEEE, Piscataway, NJ 2020, pp. 1777–1786.
- S. Moran, P. Marza, S. McDonagh, S. Parisot, G. Slabaugh, in CVPR Seattle, IEEE, Piscataway, NJ 2020.
- C. Gong, D. Wang, M. Li, V. Chandra, Q. Liu, in CVPR, Virtual, IEEE, Piscataway, NJ 2021.
- A. Radford, L. Metz, S. Chintala, in ICLR, Caribe Hilton, San Juan, Puerto Rico, 2016.
- T. De Bel, J.-M. Bokhorst, J. Van Der Laak, G. Litjens, Med. Image Anal. 2021, 70, 102004.
- A. Siarohin, S. Lathuiliere, E. Sangineto, N. Sebe, IEEE Trans. Pattern Analysis Mach. Intell. 2021, 43, 1156.
- O. Ronneberger, P. Fischer, T. Brox, in Medical Image Computing and Computer-Assisted Intervention, Pt III (Eds.: N. Navab, J. Hornegger, W. M. Wells, A. F. Frangi), Springer-Verlag, Munich 2015, pp. 234–241.
- J. Long, E. Shelhamer, T. Darrell, in 2015 IEEE Conf. on Computer Vision and Pattern Recognition, IEEE, Piscataway, NJ 2015, pp. 3431–3440.
- H. Zhao, J. Shi, X. Qi, X. Wang, J. Jia, in 30th IEEE Conf. on Computer Vision and Pattern Recognition, IEEE, Piscataway, NJ 2017; pp 6230–6239.
- L.-C. Chen, G. Papandreou, I. Kokkinos, K. Murphy, A. L. Yuille, IEEE Trans. Pattern Anal. Mach. Intell. 2018, 40, 834.
- K. He, G. Gkioxari, P. Dollar, R. Girshick, in 2017 IEEE Int. Conf. on Computer Vision, IEEE, Piscataway, NJ 2017, pp 2980–2988.
- J. Fu, J. Liu, H. Tian, Y. Li, Y. Bao, Z. Fang, H. Lu, in 2019 IEEE/CVF Conf. on Computer Vision and Pattern Recognition (CVPR), IEEE, Piscataway, NJ 2019, pp. 3141–3149.
- M. Feng, L. Zhang, X. Lin, S. Z. Gilani, A. Mian, Pattern Recognition 2020, 107, 107446.
- C. Peng, J. Ma, Pattern Recognition 2020, 107, 107498.
- H. Hu, Q. Li, Y. Zhao, Y. Zhang, IEEE Trans. Ind. Inform. 2021, 17, 2880.
- Q. Jin, H. Cui, C. Sun, Z. Meng, L. Wei, R. Su, Expert Syst. Applic. 2021, 176, 114848.
- Y. Yang, S. Soatto, in 2020 IEEE/CVF Conf. on Computer Vision and Pattern Recognition, IEEE, Piscataway, NJ 2020, pp. 4084–4094.
- H. Ma, X. Lin, Z. Wu, Y. Yu, in CVPR, 2021.
- R. Girshick, J. Donahue, T. Darrell, J. Malik, in 2014 IEEE Conf. on Computer Vision and Pattern Recognition, IEEE, Piscataway, NJ 2014, pp. 580–587.
- S. Ren, K. He, R. Girshick, J. Sun, in Advances in Neural Information Processing Systems, Vol. 28 (Eds.: C. Cortes, N. D. Lawrence, D. D. Lee, M. Sugiyama, R. Garnett), IEEE Computer Soc, Los Alamitos, CA 2015.
- J. Redmon, S. Divvala, R. Girshick, A. Farhadi, in 2016 IEEE Conf. on Computer Vision and Pattern Recognition, IEEE, Piscataway, NJ 2016, pp. 779–788.
- W. Liu, D. Anguelov, D. Erhan, C. Szegedy, S. Reed, C.-Y. Fu, A. C. Berg, in Computer Vision—Eccv 2016, Pt I, Vol. 9905 (Eds.: B. Leibe, J. Matas, N. Sebe, M. Welling), 2016, pp. 21–37.
- H. Law, J. Deng, in Computer Vision—ECCV 2018, Pt XIV, Vol. 11218 (Eds.: V. Ferrari, M. Hebert, C. Sminchisescu, Y. Weiss), Springer-Verlag, Berlin 2018, pp. 765–781.
- B. Yang, S. Wang, A. Markham, N. Trigoni, Int. J. Comput. Vision 2020, 128, 53.
- Q. Wang, M.-K. Kim, Adv. Eng. Inform. 2019, 39, 306.
- F. Hu, J. Zhao, Y. Huang, H. Li, Comput.-Aid. Civil Infrastruct. Eng. 2021, 36, 89.
- Z. Zhou, Y. Zhang, H. Foroosh, in CVPR (virtual event) 2021.
- S. Schreiberhuber, J. Prankl, T. Patten, M. Vincze, in 2019 Int. Conf. on Robotics and Automation (Eds.: A. Howard, K. Althoefer, F. Arai, F. Arrichiello, B. Caputo, J. Castellanos, K. Hauser, V. Isler, J. Kim, H. Liu, P. Oh, V. Santos, D. Scaramuzza, A. Ude, R. Voyles, K. Yamane; A. Okamura), IEEE, Piscataway, NJ 2019, pp. 140–146.
- Y. Nie, X. Han, S. Guo, Y. Zheng, J. Chang, J. J. Zhang, in 2020 IEEE/CVF Conf. on Computer Vision and Pattern Recognition (CVPR), IEEE, Piscataway, NJ 2020, pp. 52–61.
- J. Lyu, B. Wu, D. Lischinski, D. Cohen-Or, H. Huang, ACM Trans. Graph. 2020, 39, 1.
- S. Mei, J. Ji, J. Hou, X. Li, Q. Du, IEEE Trans. Geosci. Remote Sens. 2017, 55, 4520.
- E. Shelhamer, J. Long, T. Darrell, IEEE Trans. Pattern Anal. Mach. Intell. 2017, 39, 640.
- I. Goodfellow, J. Pouget-Abadie, M. Mirza, B. Xu, D. Warde-Farley, S. Ozair, A. Courville, Y. Bengio, Commun. ACM 2020, 63, 139.
- A. Kadurin, S. Nikolenko, K. Khrabrov, A. Aliper, A. Zhavoronkov, Mol. Pharm. 2017, 14, 3098.
- Y. Li, S. Li, P. Bai, W. Jia, Q. Xu, Y. Meng, L. Ma, Y. Tian, J. Colloid Interface Sci. 2021, 599, 667.
- Q. Liu, X. Li, Q. He, A. Khalil, D. Liu, T. Xiang, X. Wu, L. Song, Small 2015, 11, 5556.
- S. Hammes-Schiffer, Science 2017, 355, 28.
- B. Ma, X. Wei, C. Liu, X. Ban, H. Huang, H. Wang, W. Xue, S. Wu, M. Gao, Q. Shen, M. Mukeshimana, A. O. Abuassba, H. Shen, Y. Su, Npj Comput. Mater. 2020, 6.
- K. Liu, Y. Tang, W. Lou, Y. Liu, J. Yang, Y. Yao, Measure. Sci. Technol. 2021, 32.
- R. Cang, H. Li, H. Yao, Y. Jiao, Y. Ren, Comput. Mater. Sci. 2018, 150, 212.
- B. Ma, X. Ban, H. Huang, Y. Chen, W. Liu, Y. Zhi, Symmetry-Basel 2018, 10.
- S. M. Azimi, D. Britz, M. Engstler, M. Fritz, F. Muecklich, Sci. Rep. 2018, 8.
- Z. Tong, H. Guo, J. Gao, Z. Wang, Constr. Build. Mater. 2019, 218, 40.
- M. Ziatdinov, O. Dyck, S. Jesse, S. V. Kalinin, Adv. Funct. Mater. 2019, 29.
- D. Chen, D. Sun, J. Fu, S. Liu, IEEE Access 2021, 9, 30858.
- B. C. F. De Oliveira, V. K. Borges, C. R. Baldo, A. G. Albertazzi Jr, Opt. Eng. 2020, 59.
- Y. Xu, Y. Zhang, M. Zhang, M. Wang, W. Xu, C. Wang, Y. Sun, P. Wei, Sensors 2021, 21, 43.
- S. Mei, H. Yang, Z. Yin, IEEE Trans. Instr. Measur. 2018, 67, 1266.
- Z. Zhao, B. Li, R. Dong, P. Zhao, in Pricai 2018: Trends in Artificial Intelligence, Part II, Vol. 11013 (Eds.: X. Geng, B. H. Kang), Springer, Cham 2018, pp. 473–481.
- C. Manzo, M. F. Garcia-Parajo, Rep. Progr. Phys. 2015, 78, 24601.
- M. Ziatdinov, S. Zhang, O. Dollar, J. Pfaendtner, C. J. Mundy, X. Li, H. Pyles, D. Baker, J. J. De Yoreo, S. V. Kalinin, Nano Lett. 2021, 21, 158.
- S. Helgadottir, A. Argun, G. Volpe, Optica 2019, 6, 506.
- B. Midtvedt, E. Olsen, F. Eklund, F. Hook, C. B. Adiels, G. Volpe, D. Midtvedt, ACS Nano 2021, 15, 2240.
- J. M. Newby, A. M. Schaefer, P. T. Lee, M. G. Forest, S. K. Lai, Proc. Natl. Acad. Sci. U. S. A. 2018, 115, 9026.
- S. Franchini, S. Krevor, Exp. Fluids 2020, 61.
- X. Wang, Q. Zeng, F. Xie, J. Wang, Y. Yang, Y. Xu, J. Li, H. Yu, Analy. Chem. 2021, 93, 7399.
- T. Wollmann, K. Rohr, Med. Image Anal. 2021, 70, 102019.
- V. Jamali, C. Hargus, A. Ben-Moshe, A. Aghazadeh, H. Hyun Dong, K. K. Mandadapu, A. P. Alivisatos, Proc. Natl. Acad. Sci. U. S. A. 2021, 118.
- Y. Yao, I. Smal, I. Grigoriev, A. Akhmanova, E. Meijering, Bioinformatics 2020, 36, 4935.
- R. Spilger, A. Imle, J.-Y. Lee, B. Mueller, O. T. Fackler, R. Bartenschlager, K. Rohr, IEEE Trans. Image Process. 2020, 29, 3681.
- Y. Kim, H. K. Park, J. Jung, P. Asghari-Rad, S. Lee, J. Y. Kim, H. G. Jung, H. S. Kim, Mater. Des. 2021, 202, 109544.
- M. Girard, A. Hagen, I. Schwerdt, M. Gaumer, L. Mcdonald, N. Hodas, E. Jurrus, J. Nucl. Mater. 2021, 552.
- J. Feng, Q. Teng, B. Li, X. He, H. Chen, Y. Li, Comput. Methods Appl. Mech. Eng. 2020, 368, 113043.
- A. Valsecchi, S. Damas, C. Tubilleja, J. Arechalde, Neurocomputing 2020, 399, 227.
- R. Bostanabad, Comput.-Aided Des. 2020, 128, 102906.
- X. Li, Y. Zhang, H. Zhao, C. Burkhart, L. C. Brinson, W. Chen, Sci. Rep. 2018, 8.
- Q. Xu, X. Sun, C.-Y. Wu, P. Wang, U. Neumann, in 2020 IEEE/CVF Conf. on Computer Vision and Pattern Recognition, IEEE, Piscataway, NJ 2020, pp. 5660–5669.
- A. Sherstinsky, Phys. D-Nonlinear Phenomena 2020, 404.
- J. M. Granda, L. Donina, V. Dragone, D.-L. Long, L. Cronin, Nature 2018, 559, 377.
- T. Xie, A. France-Lanord, Y. Wang, Y. Shao-Horn, J. C. Grossman, Nat. Commun. 2019, 10.
- Z. Xiong, Y. Cui, Z. Liu, Y. Zhao, M. Hu, J. Hu, Comput. Mater. Sci. 2020, 171.
- J. C. Rodriguez Gamboa, A. J. Da Silva, I. C. S. Araujo, E. Eva Susana Albarracin, C. M. A. Duran, Sens. Actuators B-Chem. 2021, 327, 128921.
- S. M. Bryce, D. T. Bernacki, S. L. Smith-Roe, K. L. Witt, J. C. Bemis, S. D. Dertinger, Toxicol. Sci. 2018, 162, 146.
- B. Midtvedt, S. Helgadottir, A. Argun, J. Pineda, D. Midtvedt, G. Volpe, Appl. Phys. Rev. 2021, 8, 011310.
Авторы: Danpeng Cheng, Wuxin Sha, Zuo Xu, Lixin Huang, Yunpeng Du, Shun Tang, Yaqing Guo, Yuan-Cheng Cao, Shijie Cheng



