Тяжёлые минералы, такие как рутил, ильменит и циркон, а также другие важные микроэлементы играют важную роль в развитии современных технологий. Интеграция гиперспектральной визуализации и искусственного интеллекта представляет собой многообещающий подход для точной идентификации тяжёлых минералов, особенно фаз, содержащих редкоземельные элементы (РЗЭ), таких как монацит.
В этом исследовании оцениваются три классификатора на основе ИИ, машина опорных векторов (SVM), нейронные сети (NN) и сверточные нейронные сети (CNN), на предмет их эффективности при классификации десяти различных минералов, распределённых по шести группам размеров зерен в диапазоне от 125 мкм до более 300 мкм. Анализ фокусируется на том, как размер зерен влияет на спектральное отражение и точность классификации.
Среди протестированных моделей SVM стабильно превосходила NN и CNN, достигая наивысшей точности, полноты и спектрального сходства, особенно в диапазоне размеров зерен 150–300 мкм. CNN продемонстрировала самую низкую производительность и часто ошибочно классифицировала спектрально схожие минералы, такие как циркон и рутил, вероятно, из-за своей одномерной архитектуры и ограниченного пространственного представления. Монацит, отличающийся выраженным поглощением Nd3+, был точно идентифицирован во всех применимых размерах зерен, что подтверждает его надежность для обнаружения редкоземельных элементов. Анализ с помощью Spectral Angle Mapper (SAM) подтвердил, что SVM и NN сохраняют лучшее спектральное сходство, чем CNN. В целом, результаты демонстрируют значительное влияние размера зерен, спектрального сходства и размера набора данных на точность классификации и общую эффективность моделей ИИ при гиперспектральном анализе минералов.
Использованные сокращения
| ИИ | Искусственный интеллект |
| CNN | Свёрточная нейронная сеть |
| SAM | Картограф спектральных углов |
| SVM | Машина опорных векторов |
| NN | Нейронная сеть |
1. Введение
Тяжелые минеральные пески являются важным ресурсом, поддерживающим инфраструктуру современных технологий. Эти пески часто содержат высокие концентрации экономически ценных минералов, таких как рутил, ильменит и циркон, которые в настоящее время считаются ключевыми товарами для таких отраслей промышленности, как аэрокосмическая, электронная, энергетическая и керамическая, как указано в [1, 2].
В дополнение к этому, тяжелые минеральные пески могут содержать минералы, содержащие редкоземельные элементы (РЗЭ), такие как монацит, который, согласно [3, 4], особенно привлек всемирный интерес из-за их важности в технологиях чистой энергии, высокопроизводительных магнитах и оборонных системах. Тяжелые минеральные пески, используемые в этом эксперименте, очень похожи на те, что найдены в Мозамбике, которые содержат высококачественный ильменит, рутил, циркон и монацит.
Среди известных мировых месторождений тяжелые минеральные пески, найденные в Мозамбике, особенно примечательны своими исключительно высокими концентрациями общих тяжелых минералов, что делает их одними из самых экономически значимых месторождений в мире [5].
Точная и эффективная идентификация и количественная оценка этих ресурсов необходимы для эффективной оценки ресурсов, геологической разведки и горнодобывающих работ. Для точной идентификации этих минералов использовались традиционные методы, такие как анализ химического состава и спектральный анализ.
В работах [6, 7, 8] описываются лабораторные методы, такие как рентгеновская дифракция (XRD), сканирующая электронная микроскопия (SEM) и масс-спектрометрия с индуктивно связанной плазмой или оптическая эмиссионная спектроскопия (ICP-MS/OES), которые часто требуют много времени, являются дорогостоящими и плохо подходят для быстрых или крупномасштабных оценок. Такие ограничения привели к интеграции гиперспектральной визуализации (HSI) в геологические науки, которая является быстрым, неразрушающим методом и одновременно фиксирует спектральную и пространственную информацию [9].
Системы HSI собирают данные об отражательной способности по сотням смежных спектральных диапазонов, что позволяет обнаруживать тонкие минералогические различия. Однако высокая размерность и спектральная избыточность, присущие таким данным, создают значительные проблемы для точной интерпретации и классификации, часто требуя использования передовых методов выбора признаков или снижения размерности, как подчеркивается в [9].
Это привело к более широкому внедрению искусственного интеллекта (ИИ), в частности алгоритмов машинного обучения (МО) и глубокого обучения (ГО), для автоматизированной идентификации минералов. ИИ успешно применяется в областях, которые охватывают переработку полезных ископаемых, прогнозирование полезных ископаемых, картирование геологоразведочных работ, картирование аномалий химической разведки, геологическое картирование, картирование кернового бурения и сегментацию минеральных фаз по данным рентгеновской микрокомпьютерной томографии [10].
С другой стороны, методы машинного обучения, как сообщается, успешно применяются в литологической классификации [11], картировании минералов [12, 13, 14] и автоматизации каротажа керна [15]. Эти приложения демонстрируют потенциал МО для повышения как эффективности, так и точности процессов геологоразведки полезных ископаемых.
В [16] машинное обучение классифицировано на пять отдельных парадигм, каждая из которых имеет определенные последствия для гиперспектральной классификации минералов:
- Контролируемое обучение: использует размеченные наборы данных для обучения и широко применяется в классификации гиперспектральных изображений. К этой группе относятся такие алгоритмы, как метод опорных векторов (SVM), искусственные нейронные сети (ИНС), случайные леса и деревья решений. Эти модели используют предопределенное сопоставление входов и выходов для эффективного обучения классификации. В недавних исследованиях по идентификации минералов SVM получил широкое признание благодаря своей надежности в пространствах признаков высокой размерности [17], что продемонстрировало превосходные результаты классификации [18, 19].
- Обучение без учителя: работает с немаркированными данными и идентифицирует кластеры или структуры на основе их характерных признаков. Этот метод полезен, когда отсутствуют точные метки, хотя он может затруднять классификацию минералов из-за спектрального сходства.
- Полуконтролируемое обучение: объединяет небольшой размеченный набор данных с большим неразмеченным набором для повышения эффективности обучения. В [18] подчёркивается, что глубокие сети, обученные с помощью полуконтролируемого обучения, могут значительно улучшить извлечение признаков и классификацию при разреженном количестве меток.
- Активное обучение: итеративно запрашивает наиболее информативные немаркированные образцы для ручной маркировки, тем самым сокращая общие затраты на маркировку. Этот подход полезен для геологических наборов данных, где экспертная маркировка требует больших затрат времени или средств.
- Перенос обучения: метод машинного обучения, использующий знания, полученные в одной области, и применяющий их к другой, часто требуя минимального дополнительного обучения. Это особенно актуально в геологических науках, где размеченные наборы гиперспектральных данных часто встречаются редко, но смежные области могут предоставлять спектральные паттерны, пригодные для переноса.
Каждая парадигма предлагает уникальные преимущества и компромиссы в зависимости от структуры набора данных, доступности меток и вычислительных ограничений.
Методы глубокого обучения, особенно свёрточные нейронные сети (CNN), привлекли внимание благодаря своей способности одновременно обрабатывать пространственную и спектральную информацию. CNN изучают иерархические представления признаков, что делает их подходящими для классификации гиперспектральных изображений со сложными текстурами.
Однако CNN также сталкиваются с такими проблемами, как риск переобучения на небольших наборах данных и отсутствие спектральной обобщаемости при недостаточном использовании пространственного контекста, как описано в [20, 21]. Это требует тщательного выбора модели, предварительной обработки и валидации при применении моделей глубокого обучения к гиперспектральным задачам.
Основная проблема гиперспектрального анализа заключается в его размерности, где множество избыточных или нерелевантных спектральных полос может снизить точность классификации. Эта проблема усугубляется нехваткой высококачественных маркированных образцов, что увеличивает риск переобучения и ограничивает обобщаемость моделей. Эти проблемы особенно важны при идентификации минералов, содержащих редкоземельные элементы, таких как монацит, где необходимо отличать тонкие спектральные особенности от спектрально схожих фаз.
Методы отбора признаков и методы сокращения полосы пытаются решить эту проблему, но могут внести новые смещения. Глубокое обучение частично смягчило эти проблемы за счет интеграции автоматического изучения признаков и сокращения размерности в саму архитектуру модели, согласно [22]. Для повышения эффективности и масштабируемости недавние исследования включали параллельные вычисления (ускорение CPU/TPU), ансамблевое обучение и гибридное машинное обучение, а также фреймворки глубокого обучения для гиперспектральной классификации [23].
CNN, в частности, могут использовать пространственно-спектральные корреляции лучше, чем традиционные модели МО, но только при условии надлежащего обучения с достаточными и сбалансированными наборами данных [24]. Как подчеркивалось в [10, 25], небольшие и неравномерные наборы данных могут привести к переобучению, что снижает обобщаемость моделей глубокого обучения.
В этом исследовании изучается классификация тяжелых минералов, в частности монацита, содержащего REE, по гиперспектральным изображениям с использованием классификаторов на основе ИИ. В нем оценивается эффективность SVM, NN и CNN при различении десяти минералов в шести группах размеров частиц. Основная цель состоит в том, чтобы оценить, как размер зерна влияет на спектральное поведение и точность классификации.
Утверждается, что размер частиц оказывает значительное влияние на отражательную способность [26, 27], где более мелкие частицы, как правило, демонстрируют более высокую отражательную способность из-за повышенного поверхностного рассеяния, в то время как более крупные частицы отражают меньше, вероятно, из-за более сильного внутреннего поглощения.
Изучая сравнительную производительность с традиционными моделями машинного обучения и глубокого обучения, это исследование вносит вклад в передовые методы неразрушающей идентификации минералов с потенциальными приложениями в геологоразведке, мониторинге окружающей среды и дистанционном зондировании.
2. Сопутствующая работа
При разведке полезных ископаемых точная идентификация минералов остается важной. Традиционные методы обычно включают ручную идентификацию на основе физических атрибутов, таких как форма и цвет, или лабораторный химический анализ с использованием рентгеновской дифракции (XRD), сканирующей электронной микроскопии (SEM) или спектроскопии. Тем не менее, эти методы обычно трудоемки, требуют больших затрат времени и средств, особенно при применении к большим наборам данных или удаленным средам. Гиперспектральная визуализация (HSI) стала преобразующим инструментом в геологических науках, позволяя проводить детальное минералогическое картирование путем одновременного сбора пространственной и спектральной информации [8, 28, 29]. Из-за высокой размерности и сложности гиперспектральных данных классическая обработка изображений и методы поверхностного машинного обучения сталкиваются с ограничениями в масштабируемости и производительности. Растущая доступность данных HSI вызвала значительный интерес к использованию искусственного интеллекта (ИИ) для автоматизированной классификации минералов.
Нейронные сети прямого распространения, такие как сверточные нейронные сети (CNN), продемонстрировали высокую эффективность в пиксельной классификации, обнаружении аномалий и целей, а также литологической дискриминации на гиперспектральных изображениях [30, 31]. Недавние разработки в области ИИ, особенно в области машинного и глубокого обучения, открыли новые возможности в гиперспектральной классификации минералов. Эти архитектуры могут автоматически извлекать иерархические признаки из спектральных данных и доказали свою особую надежность в сценариях с перекрывающимися спектральными откликами. Глубокие нейронные сети (DNN), с меньшим количеством созданных вручную признаков и более глубокими слоями, обучаются непосредственно на необработанных данных и более эффективно масштабируются для сложных геологических сред, снижая зависимость от ручного проектирования признаков [32, 33].
Согласно [10], модели ИИ для идентификации минералов можно сгруппировать в три основные категории: (i) Искусственные нейронные сети (ИНС), которые часто зависят от наборов данных, подобранных экспертами; (ii) модели машинного обучения, которые включают статистические и основанные на правилах алгоритмы; и (iii) модели глубокого обучения, которые используют иерархическое обучение признакам для приближения к принятию решений, подобному человеческому. Подходы к глубокому обучению, такие как CNN и ResNet, получают все большее предпочтение из-за их способности учиться непосредственно на неструктурированных данных без эвристик, специфичных для предметной области. Например, в [10] показано, что классификаторы на основе Resnet достигают точности более 91% при классификации минералов на изображениях с более низким разрешением, предлагая надежную альтернативу в случаях, когда высококачественные данные недоступны.
Дальнейшее развитие этих алгоритмов привело к появлению специализированных моделей, таких как гибриды Mineral-ResNet и CNN-LSTM. В [31] эти модели сравнивались с традиционными методами машинного обучения, такими как kNN, SVM, LR, RF, XGB и CatBoost, и сообщалось о точности классификации, превышающей 90% при использовании необработанных гиперспектральных данных. Их подход минимизировал этапы предварительной обработки, такие как выбор или аугментация признаков, упрощая конвейер и уменьшая смещение. Более того, в [34] применялись CNN для классификации как типов минералов, так и распределений размеров зерен на гиперспектральных изображениях, оптимизируя обучение с помощью методов Adam и стохастического градиентного спуска. В [35] была представлена модульная структура CNN, адаптированная для классификации тонких срезов, что указывает на гибкость глубокого обучения в разрешениях изображений.
Для повышения эффективности классификации тяжелых минеральных песков, содержащих РЗЭ, недавние исследования включали трансферное обучение, адаптивный выбор признаков и гибридное наложение моделей. В [36] была представлена глубокая остаточная сеть (D-ResNet) для разведки минералов пляжного песка, подчеркивая ее способность идентифицировать ильменит, монацит и циркон с высокой пространственной точностью. С другой стороны, в [37] исследовалась эффективность трансферного обучения в процессах, включающих ограниченные маркированные данные. Они подчеркнули необходимость надежной адаптации домена, особенно в отдаленных или плохо отображенных на карте геологических средах. Аналогичным образом, в [38] был предложен конвейер сегментационной классификации, который интегрировал гибридные спектральные пространственные признаки для классификации на уровне зерен в россыпных месторождениях. Эти инновации решают ключевые проблемы, такие как спектральная путаница, снижение размерности и пространственная неоднородность.
Несмотря на эти достижения, остается несколько ограничений. Спектральное смешивание ограничивает аннотированные наборы данных и отсутствие наборов данных для сравнительного анализа, что ограничивает обобщаемость моделей [29].
Традиционные алгоритмы машинного обучения, такие как деревья решений или SVM, часто не обладают способностью моделировать высокую внутриклассовую изменчивость, обнаруженную в образцах природных минералов, как описано в [6]. Методы, основанные на правилах, включая PCA и PLS, склонны к переобучению и часто требуют обширной предварительной обработки для удаления избыточных полос.
Модели глубокого обучения, хотя и мощные, ограничены доступностью больших маркированных наборов данных и вычислительных ресурсов. В [39] подчеркивается необходимость надежных фреймворков, способных к переносу доменов и количественной оценке неопределенности для масштабирования приложений глубокого обучения в различных геологических ландшафтах.
Для устранения этих пробелов в настоящем исследовании используются современные фреймворки искусственного интеллекта для разработки системы классификации на основе глубокого обучения для гиперспектральной идентификации песков тяжёлых минералов, обогащённых редкоземельными элементами. Модели делают акцент на масштабируемой классификации с минимальной предварительной обработкой, стремясь заменить трудоёмкие лабораторные процессы альтернативными решениями на основе искусственного интеллекта, которые являются экономически эффективными и геологически доступными.
3. Материалы и методы
Для решения проблем идентификации минералов, возникающих на основе многомерных гиперспектральных данных, в этом исследовании объединены подходы машинного обучения и глубокого обучения, способные изучать дискриминантные спектрально-пространственные характеристики минералов, содержащих РЗЭ.
Предлагается структура на основе искусственного интеллекта для классификации гиперспектральных изображений песка тяжелых минералов с особым акцентом на идентификацию минералов, содержащих РЗЭ, таких как монацит. В данном контексте ИИ относится как к методам машинного обучения, таким как SVM и NN, так и к глубокому обучению, которым в данном случае является CNN. Их выбор был обусловлен их способностью извлекать и изучать сложные спектральные паттерны из многомерных данных [40, 41], что может обеспечить точную классификацию геологоразведочных работ, связанных с минералами, связанными с РЗЭ.
Традиционные камеры используют три полосы спектра длин волн в видимом диапазоне (RGB) для сбора данных, что ограничивает получение более подробной спектральной информации для дискриминации минералов. Напротив, гиперспектральная съемка обеспечивает подробные спектральные сигнатуры, что позволяет различать минералы с перекрывающимися цветовыми профилями и отчетливыми характеристиками поглощения, как указано в [42].
Разработка в последние годы гиперспектральных камер с большим количеством спектральной информации получила место в различных областях наук о Земле. Гиперспектральные данные были получены с помощью камеры SPECIM IQ, которая захватывает отражение в видимом и ближнем инфракрасном (VNIR) диапазоне длин волн 400–1000 нм со спектральным разрешением 7 нм, что дает 204 спектральных полосы и 512 пространственных пикселей на полосу. Чтобы минимизировать краевой шум, обычно присутствующий в гиперспектральных датчиках, эксперимент был сосредоточен только на диапазоне 450–950 нм, предполагая, что этот диапазон обеспечивает баланс между информационным содержанием и спектральной стабильностью для классификации минералов.
Набор данных включает десять распространённых минералов, встречающихся в тяжёлых минеральных песках, включая минералы, связанные с редкоземельными элементами, такие как монацит, и промышленно значимые минералы, такие как ильменит, рутил, циркон и ставролит, а также другие минералы, включая эпидот, кианит, плеонаст (феррошпинель), турмалин и кварц. Для обеспечения согласованности изображений и снижения внутриклассовой изменчивости, обусловленной размером зерен или текстурой поверхности, образцы собирались и обрабатывались в рамках контролируемого рабочего процесса, состоящего из трёх основных этапов: дробление исходного сырья и фотографирование, сбор гиперспектральных данных и контролируемая классификация изображений с использованием искусственного интеллекта.
Полученные гиперспектральные изображения обрабатывались с помощью графического пользовательского интерфейса приложения MATLAB под названием APiS (интеллектуальный спектральный анализатор на базе искусственного интеллекта) [43], разработанного на основе версии MATLAB R2023a. На начальном этапе была проведена спектральная визуализация каждого минерала для понимания их индивидуальных характеристик отражения. Приложение позволяет пользователю выбирать рабочий спектральный диапазон и применять рабочие процессы классификации, основанные на машинном или глубоком обучении. Все модели обучались с использованием контролируемой классификации, а данные были разделены на 90% для обучения и 10% для тестирования. Классы минералов аннотировались вручную.
Были оценены три модели:
- Свёрточная нейронная сеть (CNN): один слой, затем пакетная нормализация, активация ReLU, глобальное усреднение, полносвязный слой и вывод SoftMax, была реализована для изучения спектральных соотношений и оптимизирована для вычислительной эффективности. Она была выбрана благодаря доказанной способности моделировать пространственные иерархии и спектральные характеристики высокого уровня на основе необработанных данных [43] (Li, L., Iskander, M. et al., 2023).
- Машина опорных векторов (SVM) была реализована с использованием ядра радиальной базисной функции (RBF). Этот алгоритм особенно эффективен для многомерных пространств признаков и продемонстрировал высокую производительность на ограниченном количестве обучающих данных, что делает его надёжным для гиперспектральных приложений с малыми выборками [42].
- Нейронная сеть (NN): в качестве базового метода глубокого обучения была обучена полностью связанная нейронная сеть прямого распространения, требующая меньше вычислительных ресурсов и имеющая возможность распознавать шаблоны во всех спектральных измерениях [33].
Эффективность модели оценивалась с использованием показателей точности, достоверности и полноты для каждого класса.
Хотя камера охватывает весь диапазон от 400 до 1000 нм, эксперимент фокусируется только на диапазоне 450–950 нм, чтобы избежать спектрального шума и обеспечить надёжность результатов классификации, сохраняя при этом критические характеристики поглощения, которые в данном случае могут быть важны для идентификации минералов, содержащих редкоземельные элементы.
Использование этого диапазона было основано на предварительных испытаниях, которые показали деградацию сигнала в обоих спектральных диапазонах. Полный рабочий процесс, от подготовки образцов до классификации изображений, представлен на рисунке 1 и представляет собой структурированный подход на основе искусственного интеллекта, разработанный для поддержки идентификации тяжёлых минеральных песков и целевого поиска редкоземельных элементов.

3.1 Сбор данных
Для проведения гиперспектральной классификации образцов тяжёлых минералов девять типов минералов: эпидот, ильменит, кианит, монацит, плеонаст (феррошпинель), рутил, ставролит, турмалин и циркон – были механически измельчены до шести стандартизированных групп размеров зерен: 125 мкм, 150 мкм, 180 мкм, 250 мкм, 300 мкм и более 300 мкм (рисунок 2). Измельчение проводилось в мельнице Pulverisette 6 при скорости вращения 400 об/мин, как минимум в два цикла для обеспечения достаточной фрагментации, особенно для уменьшения количества частиц негабаритного размера.

Рисунок 2. Образцы горных пород, отобранные для дробления и анализа (исключая кварц). На изображении представлены десять образцов минералов, использованных в данном исследовании. Девять из них – монацит, кианит, эпидот, рутил, ставролит, циркон, турмалин, плеонаст и ильменит – были измельчены и проанализированы. Кварц использовался в качестве классификационного эталона, но не подвергался дроблению в процессе подготовки образцов.
3.2. Получение гиперспектральных данных и извлечение признаков
Фракции размера зерна были получены с помощью гиперспектральной камеры в контролируемых условиях в Лаборатории управления ресурсами в Школе инженерии в Университете Хоккайдо. Каждая группа была сфотографирована в темной комнате с галогенными лампами под углом падения 45°, чтобы минимизировать окружающие помехи и оптимизировать захват отражения ( Рисунок 3 ).
Камера была расположена на 30 см над образцом, чтобы обеспечить постоянство изображения. Каждое получение включало время интеграции 30 мс и время записи 45 с. Качество изображения проверялось в режиме реального времени с помощью встроенного системного интерфейса ( Рисунок 4 ), который отображал гистограммы для принятия решений о захвате.
При этом белые пики указывали на оптимальную экспозицию, тогда как синие и красные пики сигнализировали о недодержанных или перенасыщенных условиях соответственно. Кроме того, положение гистограммы относительно порога использовалось для подтверждения того, адекватно ли освещение покрывает спектральный диапазон. Например, если значения попадали на левую сторону порога, это указывало на недостаточное освещение во всем диапазоне длин волн.

Рисунок 3. Регулировка высоты камеры во время получения изображения. Изображение демонстрирует настройку камеры и расстояние от пластины образца во время получения гиперспектрального изображения, что обеспечивает равномерное освещение и фокусировку.

Рисунок 4. Интерфейс проверки качества гиперспектральных данных. На рисунке показан встроенный экран прибора, используемый для проверки качества изображения перед сохранением. Отображаемое изображение включает схему расположения минералов и настройки для подтверждения или отмены снимка.
На рисунке 5 представлены профили отражения для всех десяти минералов (включая кварц) в их неизмельченном виде, устанавливающие базовые спектры. Напротив, на рисунке 6 показаны спектральные профили измельченных минералов, сгруппированных по размерам зерен, демонстрирующие, как размер частиц влияет на спектральное отражение и поглощение, особенно в ближней инфракрасной области (700–950 нм).
Спектральное сходство между определенными группами минералов представляло собой проблему на протяжении всего процесса классификации, что, как полагают, объясняется не только алгоритмическими ограничениями, но и присущим спектральным перекрытием между классами минералов. Хотя метод SVM позволил уменьшить некоторые из этих ошибок, полное разделение оставалось затруднительным, что подчеркивает важность эталонных спектральных данных высокого разрешения и потенциального использования методов экстракции, также поддерживаемых [44, 45, 46].

Рисунок 5. Профили отражения неизмельченных образцов минералов в спектре VNIR-SWIR (450–950 нм). На рисунке показаны спектральные характеристики отражения десяти минералов: кварца, монацита, кианита, эпидота, рутила, ставролита, циркона, турмалина, плеонаста и ильменита. Кварц демонстрирует наивысшую отражательную способность во всем спектре, в то время как другие минералы демонстрируют четкие, но более низкие характеристики отражения. Выраженные особенности поглощения монацита обеспечивают спектральную уникальность, критически важную для классификации. Базовые профили служат спектральными эталонами для оценки влияния размера частиц в измельченных образцах.
3.3 Подготовка набора данных классификации
3.4 Обучение модели и выбор алгоритма
3.4.1 Классическое машинное обучение
Гиперспектральные сигнатуры недробленых минералов использовались для обучения и тестирования 36 алгоритмов машинного обучения, включая следующие:
- Деревья решений: точные, средние и грубые.
- Дискриминант: линейный и квадратичный.
- Логистическая регрессия: бинарная GLM и эффективная.
- Наивный байесовский алгоритм: основанный на гауссовском и ядерном алгоритме.
- Машина опорных векторов: линейная, квадратичная, кубическая, ядерная и гауссова.
- Метод K-ближайших соседей: взвешенный, точный, средний, грубый, косинусный и кубический.
- Нейронная сеть: узкая, средняя, широкая, двухслойная и трехслойная.
- Методы ансамбля: RUS Boosted, Boosted Trees, Bagged Trees, Subspaces Discriminant и другие.
Каждая модель обучалась на 90% данных, а 10% были зарезервированы для тестирования с использованием интерфейса APiS MATLAB. Для двух наиболее эффективных моделей мы рассчитали показатели точности, достоверности, полноты и F1-оценки, чтобы сравнить их эффективность.
3.4.2 Глубокое обучение (CNN)
Одновременно с этим модель одномерной сверточной нейронной сети (CNN) обучалась отдельно с использованием конфигурации по умолчанию, предоставляемой программным пакетом (APiS), разработанным на основе MATLAB (R2023a) и опубликованным в 2024 году. Производительность CNN сравнивалась с лучшими классическими моделями для оценки пригодности для классификации минералов при различных размерах зерен.
Предполагается, что одномерные CNN, хотя и подходят для спектральной информации, могут быть неадекватны в сложных минералогических контекстах, особенно когда пространственные сигналы необходимы для различения. Как утверждается в [47], одномерные CNN не включают пространственную информацию и могут испытывать трудности с внутриклассовой изменчивостью, что и наблюдалось в данном исследовании. Включение двумерных или трехмерных CNN или гибридных моделей может улучшить производительность в будущих приложениях.
3.5. Метрики оценки и анализ спектрального углового картографа
Чтобы оценить визуализацию этих моделей, на основе матриц путаницы, полученных в результате классификации, были рассчитаны такие показатели, как точность (количество предсказанных классов, которые были правильно помечены), полнота (количество случаев, когда класс был классифицирован правильно) и оценка F1 (сравнение между ними, другими словами, общая эффективность классификации) [48].
Для дальнейшей оценки того, как каждая модель выполнила классификацию групп размеров частиц, для каждого классифицированного изображения с помощью Python был вычислен Spectral Angle Mapper (SAM). Алгоритм SAM находит сходства между эталонным спектром из наземных данных и классифицированным изображением [49].
Это обеспечивает лучшее понимание качества и точности результатов классификации на основе классифицированных изображений. Статистика, представленная в Таблице 3, была получена из классифицированных изображений в группе I.
Среднее значение SAM иллюстрирует спектральное сходство между эталонными данными и выходными данными, а более низкое значение может представлять лучшую точность классификации. Несмотря на то, что оно было вычислено после классификации, SAM может быть использовано для проверки и улучшения классификации путем определения точности и согласованности классификации, включая, в данном случае, оценку производительности модели.
4. Результаты и обсуждение
4.1 Влияние размера частиц на отражательную способность и классификацию
Основная проблема анализа гиперспектральных данных заключается в эффективной обработке и классификации спектральных характеристик. Профили отражения (рис. 6) иллюстрируют чёткую взаимосвязь между размером частиц и спектральным откликом различных минералов. В целом, меньшие размеры зёрен (125 мкм) демонстрируют более высокую отражательную способность из-за повышенного поверхностного рассеяния; в то же время более крупные зёрна (>300 мкм) отражают меньше света из-за более сильного внутреннего поглощения.
Это поведение варьируется в зависимости от минерала, где ильменит, турмалин и плеонаст стабильно демонстрируют низкую отражательную способность во всех размерах. Примечательно, что турмалин демонстрировал более высокую отражательную способность в неизмельченном состоянии, которая значительно снизилась после измельчения. Кианит, демонстрирующий среднюю отражательную способность до измельчения, показал повышенную отражательную способность в измельченном виде.
Эпидот, представленный как в группах 125 мкм, так и выше 300 мкм, имел более низкую отражательную способность, чем ставролит в неизмельченном состоянии, но превосходил ставролит при 125 мкм. Выше 300 мкм оба минерала показали сопоставимую отражательную способность. Циркон превзошел рутил как в неизмельченном виде, так и в измельченном виде в диапазонах от 125 мкм до 180 мкм.

Рисунок 6. Профили отражения девяти измельченных образцов в разных группах размеров частиц (от 125 мкм до более 300 мкм). Спектральное отражение показано для монацита, кианита, эпидота, рутила, ставролита, циркона, турмалина, плеонаста и ильменита. Более мелкие частицы (125–150 мкм) обычно демонстрируют более высокое отражение из-за повышенного рассеяния поверхностью, в то время как частицы размером более 300 мкм демонстрируют повышенное поглощение и пониженное отражение. Эти тенденции особенно выражены в ближней инфракрасной области (NIR) (700–950 нм), где спектральные различия влияют на точность классификации в моделях ИИ. Монацит сохранил стабильный спектральный профиль во всех размерах с отличительными особенностями поглощения при 580 нм, 740 нм, 800 нм и 870 нм, связанными с присутствием фаз Nd 3+. Эти характеристики соответствуют предыдущим отчётам [49, 50, 51] и подтверждают потенциал монацита как надёжного минерала-индикатора редкоземельных элементов. Важно отметить, что, хотя многие минералы демонстрировали изменённые профили после дробления (рис. 6), спектральная стабильность монацита сохранялась, что повышало надёжность его классификации.
Эти результаты подтверждают обратную зависимость между размерами частиц и отражательной способностью и подчеркивают, что спектральные сдвиги, зависящие от размера, могут существенно влиять на результаты классификации, особенно в случае минералов с перекрывающимися характеристиками поглощения.
4.2. Эффективность модели при разных размерах частиц
Квадратический SVM и средняя NN стабильно превосходили другие протестированные алгоритмы, достигая точности свыше 95% (таблица 1). Модели 1D-CNN показывали переменные результаты, точность от 59% до 86%, причем производительность снижалась для частиц большего размера (>300).
Таблица 1. Показатели эффективности проверки и тестирования моделей ИИ для разных размеров частиц.
| Particle Size (μm) | Model Type | Accuracy % (Validation) | Total Cost (Validation) | Accuracy % (Test) | Total Cost (Test) |
|---|---|---|---|---|---|
| 125 | SVM | 95.03 | 303 | 96.45 | 24 |
| NN | 97.39 | 159 | 98.82 | 8 | |
| CNN | 74.37 | ||||
| 150 | SVM | 97.06 | 509 | 97.29 | 52 |
| NN | 97.43 | 445 | 98.28 | 33 | |
| CNN | 86.16 | ||||
| 180 | SVM | 96.85 | 510 | 96.55 | 62 |
| NN | 96.74 | 527 | 97.61 | 43 | |
| CNN | 82.53 | ||||
| 250 | SVM | 96.85 | 510 | 96.55 | 62 |
| NN | 96.74 | 527 | 97.61 | 43 | |
| CNN | 82.53 | ||||
| 300 | SVM | 96.85 | 510 | 96.55 | 62 |
| NN | 96.74 | 527 | 97.61 | 43 | |
| CNN | 82.53 | ||||
| >300 | SVM | 96.04 | 283 | 96.22 | 30 |
| NN | 96.77 | 231 | 95.47 | 36 | |
| CNN | 59.89 |
SVM и NN правильно идентифицировали большинство минералов всех размеров (Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10, Рисунок 11 и Рисунок 12 б) с самой высокой надежностью в диапазоне 150–300 мкм. Ошибочные классификации были наиболее распространены среди спектрально похожих минералов, таких как плеонаст и ильменит как турмалин или кианит как циркон.
С другой стороны, CNN (Рисунок 7, Рисунок 8, Рисунок 9, Рисунок 10, Рисунок 11 и Рисунок 12 в) идентифицировали монацит, рутил, ильменит и турмалин, но показали меньшую точность, особенно для плеонаста, ильменита и ставролита. Более крупные частицы усиливали ошибки классификации из-за потери мелких спектральных деталей и увеличения эффектов затенения.

Рисунок 7. Схема образца и результаты классификации для группы размеров частиц 125 мкм. ( a ) Изображение RGB обучающих образцов минералов: A — Монацит, B — Плеонаст, C — Рутил, D — Ставролит, E — Кианит, F — Турмалин, G — Ильменит, H — Эпидот, I — Циркон. ( b ) Результаты классификации с использованием сверточной нейронной сети (CNN). ( c ) Результаты классификации с использованием машины опорных векторов (SVM). Цветовая кодировка легенды представляет собой предсказанные классы минералов. CNN значительно неправильно классифицировала кианит и ильменит, в то время как SVM обеспечила более четкую сегментацию, особенно для монацита, рутила и турмалина.

Рисунок 8. Результаты классификации для группы частиц размером 150 мкм. ( a ) Схема RGB обучающих образцов: A — Монацит, B — Плеонаст, C — Рутил, D — Ставролит, E — Кианит, F — Турмалин, G — Ильменит, H — Циркон. ( b ) Результаты классификации CNN. ( c ) Результаты классификации SVM. SVM показал четкую классификацию турмалина и рутила, в то время как CNN ошибочно классифицировала плеонаст как ильменит и циркон.

Рисунок 9. Результаты классификации для группы частиц размером 180 мкм. ( a ) Схема RGB обучающих образцов: A — плеонаст, B — рутил, C — ставролит, D — кианит, E — турмалин, F — ильменит, G — циркон. ( b ) Результаты классификации CNN. ( c ) Результаты классификации SVM. SVM эффективно классифицировал рутил и циркон, тогда как CNN выявила путаницу между плеонастом и турмалином.

Рисунок 10. Результаты классификации для группы частиц размером 250 мкм. ( a ) Схема RGB обучающих образцов: A — плеонаст, B — рутил, C — ставролит, D — кианит, E — турмалин, F — ильменит, G — циркон. ( b ) Результаты классификации CNN. ( c ) Результаты классификации SVM. SVM предоставила согласованные результаты для большинства минералов, в то время как CNN ошибочно классифицировала ильменит и циркон как турмалин и плеонаст соответственно.

Рисунок 11. Результаты классификации для группы частиц размером 300 мкм. ( a ) RGB-схема обучающих образцов: A — плеонаст, B — рутил, C — ставролит, D — кианит, E — турмалин, F — ильменит, G — циркон. ( b ) Результаты классификации CNN. ( c ) Результаты классификации SVM. Обе модели точно классифицировали турмалин и рутил; однако CNN чаще ошибочно классифицировала плеонаст и циркон.

Рисунок 12. Результаты классификации для группы частиц размером >300 мкм. ( a ) Схема RGB обучающих образцов: A — кварц, B — плеонаст, C — рутил, D — ставролит, E — кианит, F — турмалин, G — ильменит, H — эпидот, I — циркон. ( b ) Результаты классификации CNN. ( c ) Результаты классификации SVM. SVM более точно сегментировала кварц, рутил и циркон, в то время как CNN испытывала трудности с идентификацией эпидота, плеонаста и кианита.
4.3 Метрики классификации и спектральная точность
Анализ F1-баллов показал, что SVM стабильно превышает 85% для большинства классов, включая фон и случай. CNN продемонстрировала большую изменчивость с резкими падениями для спектрально схожих или чувствительных к размеру минералов, таких как плеонаст, ильменит и ставролит. Монацит, кианит и циркон достигли высоких F1-баллов в обеих моделях, хотя SVM остался более надежным, как показано в Таблице 2.
Похожая картина была также отмечена в целом ( Таблица 3 ), где SVM достиг наивысшей точности (97,07%) и сбалансированной F1-баллы (86,85%). CNN, однако, зафиксировала самые низкие показатели производительности со сниженной точностью (73,57%) и полнотой (70,06%), особенно в мелкозернистой классификации, такой как 125 мкм.
Результаты спектрального картографирования углов (SAM), представленные в таблице 4 (полученные по данным группы I), продемонстрировали более высокую спектральную точность для SVM и NN, особенно в диапазоне от 150 до 300 мкм, где средние значения SAM были самыми низкими.
Модели CNN систематически давали более высокие значения SAM, что отражало более высокие спектральные искажения и ошибки классификации. Дополнительные показатели качества, такие как энтропия, пиковое отношение сигнал/шум (PSNR) и индекс структурного сходства (SSIM), подтвердили превосходную пространственную и спектральную целостность результатов SVM и NN.
Таблица 2. Сравнительная эффективность классификации моделей ИИ по группам размеров зерна, определенная с использованием точности, полноты и оценки F1.
| 25 μm | SVM | NN | CNN | ||||||
|---|---|---|---|---|---|---|---|---|---|
| Class | Precision | Recall | F1-Score | Precision | Recall | F1-Score | Precision | Recall | F1-Score |
| BG | 97.71 | 99.71 | 98.71 | 96.87 | 99.56 | 98.2 | 83.87 | 97.52 | 90.13 |
| Case | 85.06 | 83.93 | 84.49 | 90.63 | 98.34 | 94.33 | 46.88 | 10.81 | 17.45 |
| Epidote | 81.94 | 88.06 | 84.87 | 88.65 | 94.57 | 91.51 | 57.58 | 80.85 | 67.23 |
| Ilmenite | 87.85 | 82.82 | 85.26 | 90.05 | 88.37 | 89.2 | 48.84 | 44.21 | 46.41 |
| Kyanite | 96.74 | 98.47 | 97.6 | 97.09 | 99.17 | 98.12 | 84.27 | 96.02 | 89.73 |
| Monazite | 93.02 | 100 | 96.37 | 93.06 | 100 | 96.39 | 41.51 | 100 | 58.67 |
| Pleonaste | 89.6 | 91.83 | 90.7 | 92.84 | 95.17 | 93.99 | 39.68 | 47.62 | 43.29 |
| Rutile | 94.23 | 97.34 | 95.76 | 94.27 | 98.99 | 96.58 | 62.07 | 72.02 | 66.65 |
| Staurolite | 84.67 | 75.76 | 79.97 | 91.21 | 83.63 | 87.24 | 23.33 | 7.61 | 11.42 |
| Tourmaline | 91.68 | 93.31 | 92.48 | 95.21 | 96.45 | 95.83 | 63.64 | 71.43 | 67.31 |
| Zircon | 97.41 | 99.36 | 98.38 | 98.49 | 99.82 | 99.15 | 74.91 | 88.49 | 81.11 |
| 150 μm | SVM | NN | CNN | ||||||
| Class | Precision | Recall | F1-Score | Precision | Recall | F1-Score | Precision | Recall | F1-Score |
| BG | 99.57 | 99.95 | 99.76 | 99.56 | 99.98 | 99.77 | 93.11 | 99.8 | 96.34 |
| Case | 92.74 | 96.09 | 94.39 | 95.75 | 99.25 | 97.47 | 86.83 | 84.13 | 85.46 |
| Ilmenite | 88 | 87.11 | 87.55 | 87.36 | 81.08 | 84.11 | 56.29 | 53.37 | 54.8 |
| Kyanite | 97.37 | 98.95 | 98.15 | 97.97 | 98.8 | 98.38 | 94.26 | 95.27 | 94.76 |
| Monazite | 95.45 | 100 | 97.66 | 93.61 | 100 | 96.7 | 87.19 | 100 | 93.2 |
| Pleonaste | 89.37 | 89.71 | 89.54 | 90.38 | 89.78 | 90.08 | 24.12 | 29.09 | 26.35 |
| Rutile | 95.94 | 94.69 | 95.31 | 96.49 | 97.38 | 96.93 | 75.78 | 73.78 | 74.77 |
| Staurolite | 88.66 | 83.42 | 85.96 | 86.55 | 77.33 | 81.67 | 60.58 | 46.67 | 52.76 |
| Tourmaline | 91.2 | 95.61 | 93.35 | 91.77 | 96.25 | 93.95 | 48.44 | 77.02 | 59.61 |
| Zircon | 98.89 | 99.71 | 99.3 | 97.59 | 99.71 | 98.64 | 81.47 | 89.29 | 85.2 |
| 180/250/300 μm | SVM | NN | CNN | ||||||
| Class | Precision | Recall | F1-Score | Precision | Recall | F1-Score | Precision | Recall | F1-Score |
| BG | 99.41 | 99.91 | 99.66 | 99.54 | 99.98 | 99.76 | 94.61 | 98.59 | 96.56 |
| Case | 91.37 | 93.95 | 92.64 | 95.73 | 98.28 | 96.99 | 83.88 | 84.53 | 84.2 |
| Ilmenite | 90 | 89.03 | 89.51 | 87.83 | 85.18 | 86.49 | 63.35 | 46.15 | 53.41 |
| Kyanite | 97.57 | 98.8 | 98.18 | 97.93 | 99.05 | 98.49 | 88.46 | 87.5 | 87.98 |
| Pleonaste | 89.85 | 90.6 | 90.22 | 88.83 | 88.39 | 88.61 | 42.86 | 51.56 | 46.79 |
| Rutile | 95.18 | 96.59 | 95.88 | 96.62 | 97.81 | 97.21 | 86.73 | 55.38 | 67.46 |
| Staurolite | 88.26 | 84.46 | 86.32 | 88.7 | 83.48 | 86.01 | 41.84 | 48.13 | 44.78 |
| Tourmaline | 94.46 | 96.68 | 95.56 | 91.13 | 94.65 | 92.85 | 53.28 | 54.17 | 53.72 |
| Zircon | 98.33 | 99.36 | 98.84 | 98.02 | 99.78 | 98.89 | 76.35 | 90.21 | 82.68 |
| >300 μm | SVM | NN | CNN | ||||||
| Class | Precision | Recall | F1-Score | Precision | Recall | F1-Score | Precision | Recall | F1-Score |
| BG | 98.66 | 99.87 | 99.26 | 98.98 | 99.94 | 99.46 | 80.22 | 99.86 | 88.91 |
| Case | 93.97 | 94.83 | 94.4 | 97.77 | 99.28 | 98.52 | 76.4 | 43.88 | 55.79 |
| Epidote | 80.56 | 88.52 | 84.36 | 87.37 | 88.04 | 87.7 | 54.75 | 59.38 | 56.96 |
| Ilmenite | 86.78 | 86.84 | 86.81 | 88.22 | 85.56 | 86.87 | 43.65 | 39.57 | 41.52 |
| Kyanite | 95.5 | 98.69 | 97.07 | 96.84 | 97.87 | 97.35 | 90.05 | 95.78 | 92.83 |
| Pleonaste | 85.47 | 88.44 | 86.94 | 92.02 | 86.1 | 88.96 | 28 | 10.45 | 15.15 |
| Quartz | 99.29 | 100 | 99.64 | 98.13 | 100 | 99.06 | 100 | 100 | 100 |
| Rutile | 95 | 100 | 97.43 | 91.99 | 100 | 95.81 | 38.82 | 37.08 | 37.93 |
| Staurolite | 84.42 | 78.34 | 81.26 | 80.26 | 77.78 | 79 | 4.35 | 1.96 | 2.69 |
| Tourmaline | 90.53 | 92.4 | 91.46 | 90.79 | 93.08 | 91.92 | 78.18 | 84.04 | 80.99 |
| Zircon | 95.96 | 98.46 | 97.19 | 95.6 | 99.28 | 97.41 | 76.44 | 73.04 | 74.71 |
Таблица 3. Общая эффективность классификации моделей ИИ (SVM, NN и CNN).
| Model | Accuracy | Precision | Recall | F1-Score |
|---|---|---|---|---|
| SVM | 97.07 | 86.92 | 87.04 | 86.85 |
| CNN | 87.86 | 73.57 | 70.06 | 70.1 |
| NN | 96.40 | 88.63 | 88.47 | 88.54 |
Таблица 4. Spectral Angle Mapper (SAM) и статистика отражения по размерам частиц для моделей ИИ.
| Particle Size (μm) | Model | Mean SAM | Mean Inten-sity | Std Dev | Median Inten-sity | Skew-ness | Kurto-sis | Entropy | Edge Density | SSIM | PSNR |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 125 | CNN | 0.659 | 0.530 | 0.477 | 0.667 | −0.116 | −1.903 | 37,159.137 | 0.306 | 0.854 | 19.659 |
| NN | 0.659 | 0.530 | 0.477 | 0.667 | −0.116 | −1.903 | 37,159.137 | 0.306 | 0.854 | 19.659 | |
| SVM | 0.625 | 0.553 | 0.465 | 0.667 | −0.203 | −1.837 | 52,027.082 | 0.307 | 0.807 | 20.020 | |
| 150 | CNN | 0.570 | 0.584 | 0.427 | 0.667 | −0.281 | −1.639 | 155,009.620 | 0.316 | 0.862 | 20.144 |
| NN | 0.560 | 0.594 | 0.424 | 0.667 | −0.334 | −1.599 | 152,966.480 | 0.315 | 0.834 | 20.120 | |
| SVM | 0.560 | 0.594 | 0.424 | 0.667 | −0.334 | −1.599 | 152,966.480 | 0.315 | 0.834 | 20.120 | |
| 180 | CNN | 0.594 | 0.561 | 0.430 | 0.333 | −0.130 | −1.718 | 167,020.220 | 0.318 | 0.910 | 22.010 |
| NN | 0.563 | 0.595 | 0.427 | 0.667 | −0.324 | −1.623 | 149,673.390 | 0.316 | 0.865 | 21.686 | |
| SVM | 0.563 | 0.595 | 0.427 | 0.667 | −0.324 | −1.623 | 149,673.390 | 0.316 | 0.865 | 21.686 | |
| 250 | CNN | 0.591 | 0.565 | 0.430 | 0.333 | −0.155 | −1.714 | 163,420.980 | 0.318 | 0.879 | 20.578 |
| NN | 0.550 | 0.607 | 0.425 | 0.667 | −0.387 | −1.578 | 144,747.860 | 0.313 | 0.845 | 20.379 | |
| SVM | 0.550 | 0.607 | 0.425 | 0.667 | −0.387 | −1.578 | 144,747.860 | 0.313 | 0.845 | 20.379 | |
| 300 | CNN | 0.596 | 0.559 | 0.430 | 0.333 | −0.121 | −1.721 | 167,090.450 | 0.319 | 0.907 | 22.100 |
| NN | 0.553 | 0.610 | 0.430 | 1.000 | −0.404 | −1.587 | 134,489.800 | 0.316 | 0.837 | 21.084 | |
| SVM | 0.553 | 0.610 | 0.430 | 1.000 | −0.404 | −1.587 | 134,489.800 | 0.316 | 0.837 | 21.084 | |
| +300 | CNN | 0.629 | 0.546 | 0.462 | 0.667 | −0.161 | −1.837 | 60,438.332 | 0.310 | 0.850 | 20.328 |
| NN | 0.673 | 0.520 | 0.480 | 0.667 | −0.077 | −1.922 | 32,796.434 | 0.307 | 0.836 | 19.492 | |
| SVM | 0.673 | 0.520 | 0.480 | 0.667 | −0.077 | −1.922 | 32,796.434 | 0.307 | 0.836 | 19.492 |
4.4 Влияние структуры обучающего набора данных
Были протестированы две стратегии обучения: группа I, в которой использовались только референтные спектры, специфичные для каждого размера частиц, и группа II, в которой одновременно использовались все десять референтных спектров для каждого размера частиц.
Группа I дала более спектрально стабильные и визуально точные карты. Группа II, напротив, показала несколько более высокие числовые показатели, но внесла больше заметных ошибок классификации, что указывает на завышенную точность из-за несоответствия наборов данных. Это подтверждает необходимость репрезентативных референтных данных, специфичных для каждого размера, для обеспечения надёжной классификации в гиперспектральных рабочих процессах на основе ИИ.
4.5. Модели ошибочной классификации и спектральное перекрытие
Постоянные ошибки классификации были связаны со спектральным сходством некоторых минералов. Распространенной ошибкой была интерпретация плеонаста и ильменита как турмалина, кианита как циркона, а ставролита как циркона или рутила. Эти ошибки наблюдались как в результатах SVM, так и в результатах CNN, но были более выражены в CNN.
Подобные ошибки классификации обусловлены как алгоритмическими ограничениями, так и естественным перекрытием спектров минералов. Даже при использовании высокопроизводительных моделей полное разделение остаётся затруднительным без улучшенной предварительной обработки. Расширенные методы извлечения спектральных признаков, такие как удаление континуума или производная спектроскопия, могут помочь уменьшить перекрытие и улучшить разделимость классов.
4.6 Оптимальные условия для картирования HMS, содержащих редкоземельные элементы
Во всех анализах размер частиц от 150 до 300 мкм обеспечивал наилучший баланс между спектральной резкостью и поверхностным рассеянием, что приводило к снижению средних значений SAM, повышению точности классификации и улучшению визуального качества. Размеры вне этого диапазона демонстрировали повышенную вероятность ошибок классификации, вероятно, из-за спектральных искажений в более мелких зернах или снижения отражательной способности и затенения в более крупных зернах.
5. Выводы
В этом исследовании оценивалась производительность моделей искусственного интеллекта, таких как опорный векторный метод (SVM), нейронная сеть (NN) и сверточная нейронная сеть (CNN), при классификации песков тяжелых минералов, содержащих редкоземельные элементы, на гиперспектральных изображениях. Результаты показали, что SVM стабильно превосходит как NN, так и CNN (таблица 4), особенно по точности, полноте и спектральной верности (таблица 2).
Хотя NN демонстрирует сопоставимую точность, ее более низкая точность указывает на трудности в различении спектрально похожих минералов. CNN, реализованная в виде одномерной архитектуры, показала худшие результаты по всем показателям, вероятно, из-за ее зависимости от больших наборов данных и отсутствия пространственного контекста в этой конфигурации.
Из десяти протестированных минералов монацит, ильменит, турмалин, кварц, циркон, рутил, кианит и эпидот были по крайней мере полностью или частично идентифицированы. В частности, монацит продемонстрировал надежную и последовательную классификацию по размерам частиц благодаря своим уникальным характеристикам поглощения Nd3+, что делает его надежным спектральным индикатором для гиперспектрального обнаружения РЗЭ.
Однако ильменит, плеонаст, рутил и ставролит часто демонстрировали перекрывающиеся спектральные сигнатуры, что приводило к устойчивой ошибочной классификации, особенно при более мелких размерах зерен. Это исследование дополнительно подтверждает, что размер частиц существенно влияет на отражательную способность и точность классификации, при этом диапазон размеров от 150 до 300 мкм дает оптимальные результаты. Более мелкие частицы, как правило, поглощали больше и скрывали спектральные сигнатуры. Кроме того, в будущих работах необходимы более надежные архитектуры и более крупные обучающие выборки.
В заключение следует отметить, что данное исследование подчёркивает потенциал машинного обучения, в частности метода опорных векторов (SVM), для гиперспектральной классификации минералов в тяжёлых минеральных песках. Несмотря на достигнутую высокую точность классификации, спектральное перекрытие, эффекты размера зерен и ограничения модели указывают на необходимость дальнейшего изучения архитектуры гибридных моделей, расширенного извлечения признаков и расширения наборов данных для повышения надёжности классификации в сложных минералогических условиях.
Насколько нам известно, это одно из первых исследований, систематически изучающих совокупное влияние размера частиц и конструкции модели ИИ на гиперспектральную классификацию тяжёлых минеральных песков, связанных с РЗЭ. Эти выводы могут быть полезны в будущих аэрокосмических и лабораторных гиперспектральных исследованиях, особенно для оптимизации выбора моделей, подготовки образцов и интерпретации данных в исследованиях, ориентированных на РЗЭ.
Литература
- Hitchman, A. Australian Resources Review: Mineral Sand 2017; Australian Government Geoscience: Canberra, Australia, 2018.
- Chakhmouradian, A.R.; Wall, F. Rare Earth Elements: Minerals, Mines, Magnets (and More). Elements 2012, 8, 333–340.
- Massari, S.; Ruberti, M. Rare earth elements as critical raw materials: Focus on international markets and future strategies. Resour. Policy 2013, 38, 36–43.
- Goodenough, K.M.; Wall, F.; Merriman, D. The Rare Earth Elements: Demand, Global Resources, and Challenges for Resourcing Future Generations. Nat. Resour. Res. 2018, 27, 201–216.
- Dumouchel, J.; Hees, F.; Alvin, M.P. Coastal evolution and associated titanium sand mineralisation of Jangamo district, Inhambane Province, Mozambique. Trans. Inst. Min. Metall. Sect. B Appl. Earth Sci. 2016, 125, 140–152.
- Hao, H.; Guo, R.; Gu, Q.; Hu, X. Machine learning application to automatically classify heavy minerals in river sand by using SEM/EDS data. Min. Eng. 2019, 143, 105899.
- Kruse, F.A. Mapping surface mineralogy using imaging spectrometry. Geomorphology 2012, 137, 41–56.
- van der Meer, F.D.; van der Werff, H.M.A.; van Ruitenbeek, F.J.A.; Hecker, C.A.; Bakker, W.H.; Noomen, M.F.; Mark van der Meijde, E.; Carranza, J.M.; de Smeth, J.B.; Tsehaie, W. Multi- and hyperspectral geologic remote sensing: A review. Int. J. Appl. Earth Obs. Geoinf. 2012, 14, 112–128.
- Li, J.; Bioucas-Dias, J.M.; Plaza, A. Semisupervised hyperspectral image classification using soft sparse multinomial logistic regression. IEEE Geosci. Remote Sens. Lett. 2013, 10, 318–322.
- Long, T.; Zhou, Z.; Hancke, G.; Bai, Y.; Gao, Q. A Review of Artificial Intelligence Technologies in Mineral Identification: Classification and Visualization. J. Sens. Actuator Netw. 2022, 11, 50.
- Cracknell, M.J.; Reading, A.M. Geological mapping using remote sensing data: A comparison of five machine learning algorithms, their response to variations in the spatial distribution of training data and the use of explicit spatial information. Comput. Geosci. 2014, 63, 22–33.
- Lou, W.; Zhang, D.; Bayless, R.C. Review of mineral recognition and its future. Appl. Geochem. 2020, 122, 104727.
- Liu, Y.; Wang, X.; Zhang, Z.; Deng, F. A review of deep leaning in image classification for mineral exploration. Min. Eng. 2023, 204, 108433.
- Zuo, R.; Carranza, E.J.M. Machine Learning-Based Mapping for Mineral Exploration. Math Geosci. 2023, 55, 891–895.
- Schnitzler, N.; Ross, P.S.; Gloaguen, E. Using machine learning to estimate a key missing geochemical variable in mining exploration: Application of the Random Forest algorithm to multi-sensor core logging data. J. Geochem. Explor. 2019, 205, 106344.
- Gewali, U.B.; Monteiro, S.T.; Saber, E. Machine learning based hyperspectral image analysis: A survey. arXiv 2018, arXiv:1802.08701.
- Zhang, L.; He, Z.; Liu, Y. Deep object recognition across domains based on adaptive extreme learning machine. Neurocomputing 2017, 239, 194–203.
- Prasad, S.; Chanussot, J. Hyperspectral Image Analysis Advances in Machine Learning and Signal Processing; Springer Nature: Berlin/Heidelberg, Germany, 2020.
- Hamedianfar, A.; Laakso, K.; Middleton, M.; Törmänen, T.; Köykkä, J.; Torppa, J. Leveraging High-Resolution Long-Wave Infrared Hyperspectral Laboratory Imaging Data for Mineral Identification Using Machine Learning Methods. Remote Sens. 2023, 15, 4806.
- Xiao, D.; Le, B.T.; Ha, T.T.L. Iron ore identification method using reflectance spectrometer and a deep neural network framework. Spectrochim. Acta A Mol. Biomol. Spectrosc. 2021, 248, 119168.
- Shirmard, H.; Farahbakhsh, E.; Heidari, E.; Beiranvand Pour, A.; Pradhan, B.; Müller, D.; Chandra, R. A Comparative Study of Convolutional Neural Networks and Conventional Machine Learning Models for Lithological Mapping Using Remote Sensing Data. Remote Sens 2022, 14, 819.
- Barraza, J.F.; Droguett, E.L.; Martins, M.R. Towards Interpretable Deep Learning: A Feature Selection Framework for Prognostics and Health Management Using Deep Neural Networks. Sensors 2021, 21, 5888.
- Alzubaidi, L.; Zhang, J.; Humaidi, A.J.; Al-Dujaili, A.; Duan, Y.; Al-Shamma, O.; Santamaría, J.; Fadhel, M.A.; Al-Amidie, M.; Farhan, L. Review of deep learning: Concepts, CNN architectures, challenges, applications, future directions. J. Big Data 2021, 8, 53.
- Son, H.; Kim, S.; Yeon, H.; Kim, Y.; Jang, Y.; Kim, S.E. Visual Analysis of Spatiotemporal Data Predictions with Deep Learning Models. Appl. Sci. 2021, 11, 5853.
- Chen, J.; Pisonero, J.; Chen, S.; Wang, X.; Fan, Q.; Duan, Y. Convolutional neural network as a novel classification approach for laser-induced breakdown spectroscopy applications in lithological recognition. Spectrochim. Acta Part B At. Spectrosc. 2020, 166, 105801.
- Salisbury, J.W.; Wald, A. The role of volume scattering in reducing spectral contrast of reststrahlen bands in spectra of powdered minerals. Icarus 1992, 96, 121–128.
- Mustard, J.F.; Pieters, C.M. Photometric phase functions of common geologic minerals and applications to quantitative analysis of mineral mixture reflectance spectra. J. Geophys. Res. 1989, 94, 13619–13634.
- Plaza, A.; Benediktsson, J.A.; Boardman, J.W.; Brazile, J.; Bruzzone, L.; Camps-Valls, G.; Chanussot, J.; Fauvel, M.; Gamba, P.; Gualtieri, A.; et al. Recent advances in techniques for hyperspectral image processing. Remote Sens. Environ. 2009, 113 (Suppl. S1), S110–S122.
- Paoletti, M.E.; Haut, J.M.; Plaza, J.; Plaza, A. Deep learning classifiers for hyperspectral imaging: A review. ISPRS J. Photogramm. Remote Sens. 2019, 158, 279–317.
- Chen, Y.; Jiang, H.; Li, C.; Jia, X.; Ghamisi, P. Deep Feature Extraction and Classification of Hyperspectral Images Based on Convolutional Neural Networks. IEEE Trans. Geosci. Remote Sens. 2016, 54, 6232–6251.
- Agrawal, N.; Govil, H. A deep residual convolutional neural network for mineral classification. Adv. Space Res. 2023, 71, 3186–3202.
- Zhang, L.; Zhang, L.; Du, B. Deep learning for remote sensing data: A technical tutorial on the state of the art. IEEE Geosci. Remote Sens. Mag. 2016, 4, 22–40.
- LeCun, Y.; Bengio, Y.; Hinton, G. Deep learning. Nature 2015, 521, 436–444.
- Okada, N.; Maekawa, Y.; Owada, N.; Haga, K.; Shibayama, A.; Kawamura, Y. Automated identification of mineral types and grain size using hyperspectral imaging and deep learning for mineral processing. Minerals 2020, 10, 809.
- Dell, P.; Eni, A. An Integrated Deep Learning Framework for Classification of Mineral Thin Sections and Other Geo-Data, a Tutorial. Minerals 2023, 13, 584.
- Theerthagiri, P.; Ruby, A.U.; Chandran, J.G.C. Prediction and classification of minerals using deep residual neural network. Neural Comput. Appl. 2024, 36, 1539–1551.
- Latif, G.; Bouchard, K.; Maitre, J.; Back, A.; Bédard, L.P. A framework for microscopic grains segmentation and classification for minerals recognition using hybrid features. Earth Sci. Inform. 2024, 17, 5823–5840.
- Wenxue, Z.; Shikun, D.; Hongjun, T.; Dexiang, Z.; Ying, Z.; Fan, J. An Overview Study of Deep Learning in Geophysics: Cross-Cutting Research to Advance Geoscience. IEEE Access 2025, 13, 124364–124388.
- Li, S.; Song, W.; Fang, L.; Chen, Y.; Ghamisi, P.; Benediktsson, J.A. Deep Learning for hyperspectral image classification: An overview. IEEE Trans. Geosci. Remote Sens. 2019, 57, 6690–6709.
- Ghamisi, P.; Plaza, J.; Chen, Y.; Li, J.; Plaza, A.J. Advanced Spectral Classifiers for Hyperspectral Images: A review. IEEE Geosci. Remote Sens. Mag. 2017, 5, 8–32.
- Salam, M.L.; Saxena, R.S. Comparative Analysis of SVM and CNN for Hyperspectral Image Classification. arXiv 2024, arXiv:7538.
- Okada, N.; Owada, N.; Takizawa, K.; Sinaice, B.B.; Muacanhia, O.; Gebretsadik, A.; Tanaka, S.; Aikawa, K.; Park, I.; Ito, M.; et al. APiS (AI powered intelligence spectrum analyser): Hyperspectral imaging machine learning analyser app for mineral processing. Int. J. Min. Reclam. Environ. 2024, 1–27.
- Li, L.; Iskander, M.; Asce, A.M.; Iskander, M.; Asce, F. Classification of Sand Using Deep Learning. J. Geotech. Geoenviron. Eng. 2023, 149, 04023103.
- Lorenz, S.; Ghamisi, P.; Kirsch, M.; Jackisch, R.; Rasti, B.; Gloaguen, R. Feature extraction for hyperspectral mineral domain mapping: A test of conventional and innovative methods. Remote Sens. Environ. 2021, 252, 112129.
- Chen, Y.; Lin, Z.; Zhao, X.; Wang, G.; Gu, Y. Deep learning-based classification of hyperspectral data. IEEE J. Sel. Top. Appl. Earth Obs. Remote Sens. 2014, 7, 2094–2107.
- Yadav, P.P.; Shetty, A.; Raghavendra, B.S.; Narasimhadhan, A.V. 1-D CNN for mineral classification using hyperspectral data. In Proceedings of the 2023 IEEE India Geoscience and Remote Sensing Symposium (InGARSS 2023), Bangalore, India, 10–13 December 2023; pp. 1–4.
- Sokolova, M.; Lapalme, G. A systematic analysis of performance measures for classification tasks. Inf. Process. Manag. 2009, 45, 427–437.
- Kruse, F.A.; Lefkoff, A.B.; Boardman, J.W.; Heidebrecht, K.B.; Shapiro, A.T.; Barloon, P.J.; Goetz, A.F.H. The spectral image processing system (SIPS)—Interactive visualization and analysis of imaging spectrometer data. Remote Sens. Environ. 1993, 44, 145–163.
- Boesche, N.K.; Rogass, C.; Lubitz, C.; Brell, M.; Herrmann, S.; Mielke, C.; Tonn, S.; Appelt, O.; Altenberger, U.; Kaufmann, H. Hyperspectral REE (Rare Earth Element) Mapping of Outcrops—Applications for Neodymium Detection. Remote Sens. 2015, 7, 5160–5186.
- Daempfling, H.L.C.; Mielke, C.; Koellner, N.; Lorenz, M.; Rogass, C.; Altenberger, U.; Harlov, D.E.; Knoper, M. Automatic element and mineral detection in thin sections using hyperspectral transmittance imaging microscopy (HyperTIM). Eur. J. Mineral. 2022, 34, 275–284.
- Asadzadeh, S.; Koellner, N.; Chabrillat, S. Detecting rare earth elements using EnMAP hyperspectral satellite data: A case study from Mountain Pass, California. Sci. Rep. 2024, 14, 20766.
Авторы: Okhala Muacanhia, Natsuo Okada, Yoko Ohtomo, Youhei Kawamura



