Люди и животные получают большую часть информации через зрительную систему. В машинах зрение обеспечивается технологией компьютерного зрения. В настоящее время технологии, основанные на зрении, играют важную роль в автоматизации различных процессов. Благодаря улучшению вычислительных мощностей, производительности и алгоритмов компьютерное зрение выполняет различные задачи, такие как обнаружение объектов, распознавание действий человека и животного, а также классификация изображений.
Применение компьютерного зрения постоянно растет в различных отраслях. В данной статье мы обобщаем применение компьютерного зрения в таких популярных областях, как астрономия, медицина, пищевая промышленность, обрабатывающая промышленность и автономные транспортные средства. Мы приводим различные методы компьютерного зрения и их эффективность в различных областях. В заключение представлен краткий обзор перспектив развития.
1. Введение
Главная цель искусственного интеллекта — сделать все компьютеррные системы интеллектуальными, чтобы они могли действовать разумно. Системы искусственного интеллекта (ИИ) более универсальны, обладают способностью рассуждать и более адаптивны. Рассуждение, обучение, решение проблем, лингвистический интеллект и восприятие — основные компоненты ИИ. Искусственный интеллект — это область интереса для многих исследователей, и это технология, которая находит применение в различных областях, таких как обработка языка, робототехника, распознавание речи, компьютерное зрение, как показано на рис. 1 [1, 2, 3, 4].

Рис. 1. Области искусственного интеллекта.
С момента появления первых цифровых компьютеров в 1960-х годах многие пытались проводить анализ изображений с помощью компьютеров раннего поколения. Некоторые из первых успехов были достигнуты в виде распознавания символов, вскоре к этому списку добавились распознавание отпечатков пальцев и номерных знаков [8].
За прошедшие годы распознавание изображений с помощью компьютеров значительно продвинулось и стало все более сложным. Компьютерное зрение (CV) находит применение в самых разных областях, от обнаружения звезд и галактик до беспилотных автомобилей [9, 10, 11].
С появлением глубокого обучения традиционное компьютерное зрение могло выполнять лишь небольшое количество задач. При всей этой ручной работе погрешности оставались высокими. Машинное обучение предложило решение этой проблемы ручной работы [12, 13].
Благодаря алгоритмам машинного обучения разработчику больше не нужно было кодировать каждый параметр в своем приложении CV. Машинное обучение помогло решить многие проблемы, которые исторически были неразрешимы, но требовали одновременной работы многих разработчиков над одним проектом и реализации алгоритмов машинного обучения для приложений CV [14].
Глубокое обучение (DL) предлагает иной подход к алгоритмам машинного обучения (ML), опираясь на нейронные сети для решения задач обработки изображений [14, 15]. Нейронные сети — это функции общего назначения, которые могут решать задачи, представленные на примерах. Нейронная сеть способна извлекать общие закономерности из размеченных данных и преобразовывать их в математические уравнения, которые могут быть использованы для классификации будущих данных [16].
В последние несколько лет ИИ широко используется в сфере услуг, таких как розничная торговля, электронная коммерция, развлечения, логистика, банковское дело и финансовые услуги. Существует множество обзорных работ по искусственному интеллекту, посвященных применению различных областей компьютерного зрения в услугах, непосредственно связанных с потребителями. Сегодня многие исследователи сосредоточены на внедрении компьютерного зрения в несервисные отрасли.
Компьютерное зрение является одной из наиболее перспективных областей ИИ для производства, медицины и астрономии. В данной статье представлен всесторонний обзор применения компьютерного зрения в таких новых областях, как астрономия, медицина, производство, строительство, пищевая промышленность, а также рассматривается, как методы компьютерного зрения применяются в различных областях для оптимизации, упрощения и автоматизации различных трудоемких ручных задач. В статье обсуждается развитие технологий компьютерного зрения, их роль в росте различных секторов и даются рекомендации по дальнейшему применению (рис. 2 ).

Рис. 2. Применение компьютерного зрения в различных областях
2. Приложения компьютерного зрения
В этом разделе представлен всесторонний обзор применения компьютерного зрения в различных областях. Рассмотренные работы сгруппированы по областям применения компьютерного зрения. В таблице 1 приведен подробный список рассмотренных подходов и их основных характеристик.
Таблица 1. Краткий обзор литературы, проведенный в области компьютерного зрения.
| Author | Methodology | Remark |
|---|---|---|
| Astronomy | ||
| D. J. Mortlock et al. | Bayesian analysis | Study of quasars beyond redshift of z = 7.085 |
| A. A. Collister and O. Lahav, S. C. Odewahn et al., David Bazell and Yuan Peng, S. C. Odewahn et al., David Bazell and Yuan Peng, Moonzarin Reza, R. Carballo et al., Ofer Lahav et al. | ANN | Classification of galaxy based on morphological data and photometric parameters, stellar/non-stellar objects |
| S. Dieleman et al. | CNN | Automating classification of galaxy based on morphological data |
| N. S. Philip et al., N. Mukund et al. | DBNN | Classifying galaxies using Difference Boosting Neural Network (DBNN) |
| N. Weir, U. M. Fayyad and S. Djorgovski, N. M. Ball et al., Joseph W. Richards et al. | Decision tree | Automated approach to galaxy classification for identification of galaxies in photometric datasets |
| Peng et al. | SVM | Quasar classification using several SVM with 93.21% efficiency |
| Medical science | ||
| Pawan Kumar Upadhyay et al. | Coherent CNN | Obtained 97% accuracy for retinal disease detection |
| Nawel Zemmal et al. | Transductive SVM | Detection of glaucoma and feature extraction using grey level co-occurrence matrix |
| Shouvik Chakraborty et al. | SUFACSO | Detection of covid-19 using CT scan images |
| Maitreya Maity et al. | C4.5 decision tree | Detection of anemia due to reduced level of hemoglobin |
| Wilson F. Cueva | ANN | Using ANN to identify “Melanoma” with 97.51% accuracy |
| Food processing | ||
| Liu et al., 2016 | PLSDA, PCA-BPNN, LS-SVM | Comparison of various methods for rice seed classification based on variety |
| Kaur and Singh, 2013 | SVM | Comparison of various methods for rice seed classification based on quality |
| Olgun et al., 2016 | SIFT + SVM | Classification of wheat grains |
| Kadir Sabanci, n.d. | ANN, SVM, decision tree, kNN | Classification of bread and durum wheat |
| Xia et al., 2019 | MLDA, LS-SVM | Maize seed classification into 17 varieties |
| Huang and Lee, 2019 | CNN | Classification of coffee by using CNN |
| Manufacturing | ||
| Christos Manettas et al., Imoto et al. | CNN | Object orientation classification wafer surface defect detection for manufacturing processes |
| Scime and Beuth | Bag of key points using SVM | Detection of faults during additive manufacturing processes |
| Self-driving cars | ||
| Gupta et al. | Deep learning | A survey of deep learning techniques for autonomous vehicles |
| Novickis et al., Chen et al. | CNN | Proposed architecture for pedestrian detection using multiple cameras |
| Muthalagu et al. | Linear regression | Improvements in lane detection systems |
2.1. Астрономия
В разделе ниже обсуждается применение алгоритмов компьютерного зрения в астрономических приложениях и то, как компьютерное зрение используется для решения задач с точки зрения астрономии. В большинстве приложений использовались наборы данных, полученные из системы каталогизации и анализа изображений неба (SKICAT) [17], обзора неба Паломарской обсерватории [18] и многих других обзоров неба. Классификация астрономических приложений показана на рис. 3.

Рис. 3. Применение компьютерного зрения в астрономии
Классификация объектов
В научном процессе классификация объектов является одним из важнейших этапов, поскольку она дает нам ключевое понимание наших наборов данных и помогает принимать оптимальные решения и минимизировать ошибки. Полнота и эффективность — две важные величины для классификации астрофизических объектов. Классификация звезд, галактик и других астрофизических объектов, таких как сверхновые, квазары, звезды и галактики, на основе фотометрических данных является важной проблемой, поскольку ручная классификация объектов по различным категориям — неудобная задача.
Это сложная задача, поскольку звезды не разрешены в фотометрических данных из-за их большого расстояния от Земли, а галактики, находящиеся дальше, выглядят как протяженные источники. Кроме того, другие астрофизические объекты также выглядят как точечные источники, такие как сверхновые и квазары; следовательно, их классификация становится сложной. Классификация на основе машинного обучения и компьютерного зрения может ускорить рабочий процесс и помочь астрофизикам сосредоточиться на других важных проблемах [19].
Одеван и др. обсудили методы применения дискриминации звезд/галактик. В своей работе они внедрили искусственную нейронную сеть и успешно классифицировали звездные и незвездные категории на основе набора из 14 параметров изображения. Были проведены простые численные эксперименты для выявления значимых параметров изображения для разделения галактик и звезд и для иллюстрации надежности модели [18]. Классификация галактик на основе морфологии с использованием автоматизированного машинного обучения может быть выполнена с помощью различных алгоритмов машинного обучения, таких как ANN, ET, DT, RF, kNN [20].
Метод опорных векторов (SVM) — алгоритм машинного обучения, который можно использовать для демонстрации идентификации квазаров в наборах данных обзоров неба, таких как SDSS, UKIDSS и GALEX. В этом подходе предлагается использовать иерархию классификаторов SVM. Согласно исследованию, результаты, полученные в ходе экспериментов, показывают, что использование нескольких классификаторов SVM более полезно, чем использование одного классификатора SVM для различения астрономических объектов. Перекрестная проверка для повышения достоверности может быть выполнена путем выбора кандидатов с использованием ранее упомянутого подхода [21].
Фотометрическое красное смещение различных астрофизических объектов
Фотометрическое красное смещение — это оценка скорости удаления астрономического объекта, сделанная без измерения его спектра, например, галактики или квазара [22]. Фотометрия используется для оценки красного смещения наблюдаемого объекта, а следовательно, и его расстояния, благодаря закону Хаббла [23].
В работе [23] исследуется новый метод прогнозирования фотометрических красных смещений на основе искусственных нейронных сетей (ИНС). ИНС требуют большого спектроскопически идентифицируемого обучающего набора, в отличие от традиционной методологии фотометрического красного смещения с использованием шаблонов.
Другие области применения в астрономии
Классификация переменных звезд находится в центре внимания многих астрофизиков. Классификация переменных звезд важна для выявления таких скрытых свойств, как масса, светимость, температура, внутренняя и внешняя структура, состав, эволюция и другие звездные свойства. Ричардс и др. [24] представили подходы к классификации переменных звезд на основе деревьев. Алгоритмы случайных лесов, деревьев классификации и регрессии, а также бустированных деревьев сравниваются с ранее использованными SVM, моделями смесей Гаусса, байесовским усреднением искусственных нейронных сетей и байесовскими сетями (рис. 4).

Рис. 4. Иерархия из набора данных, используемого для классификации переменных звезд [ 24 ].
Наилучшим классификатором с точки зрения общего уровня ошибок классификации является случайный лес (RF) с B = 1000 деревьями, который достигает среднего уровня ошибок классификации в 22,8%. Классификатор HSC–RF с B = 1000 деревьями имеет самый низкий уровень катастрофических ошибок — 7,8%.
2.2. Медицинские науки
С появлением машинного обучения и компьютерного зрения область медицинских исследований претерпела значительные изменения и эволюционировала ускоренными темпами во многих секторах медицинской науки, таких как выявление неврологических заболеваний, распознавание лиц, проблемы сетчатки и многое другое. Последние достижения в области классификации изображений и идентификации объектов могут существенно помочь в медицинской визуализации.
Выявление заболеваний сетчатки
Изображения оптической когерентной томографии (ОКТ) используются для диагностики заболеваний сетчатки с помощью методов машинного обучения [25]. Такие тяжелые заболевания, как катаракта и глаукома, стали одними из причин слепоты. Модели на основе машинного обучения используются для упрощения трудоемкой задачи обнаружения заболеваний глаз путем автоматизации процесса.
Используются генетический алгоритм и трансдуктивная техника обертки SVM. Для проверки предложенного автором подхода использовался набор данных RIM-ONE, который служит эталоном. В результате RIM-ONE используется для улучшения алгоритмов. Для этой задачи используется база данных RIM-ONE R3. Учитывая возможность прямой классификации изображений, для извлечения признаков выбрана матрица совместной встречаемости уровней серого (GLCM) и вектор дескрипторов. Вектор дескрипторов состоит из тринадцати подходящих признаков, извлеченных из матрицы [26].
Чакраборти и Мали [27] обсудили методы обнаружения COVID-19 с использованием радиологического анализа изображений КТ-сканирования. Автор предложил новую методику сегментации изображений КТ-сканирования на основе суперпикселей, которая хорошо справляется с этой задачей и ускоряет процесс покоя новой коронавирусной инфекции.
Анализ патофизиологических изменений в эритроцитах имеет решающее значение для раннего выявления анемии. Анемия — наиболее распространенное заболевание крови, при котором наблюдается дефицит эритроцитов или гемоглобина. Автор использовал инструменты обработки изображений. В данном исследовании для описания инфицированных эритроцитов используется тонкий мазок крови. Случайным образом выбраны 100 пациентов в возрасте от 25 до 50 лет, у каждого из которых взяты образцы крови. Затем каждый образец крови обрабатывается для получения тонких мазков крови [28] (рис. 5).

Рис. 5. Схема рабочего процесса предлагаемой системы скрининга [28].
Рак кожи можно обнаружить с помощью компьютерных технологий, как показали различные исследования. Как следует из научной литературы, рак кожи, если его не диагностировать на ранней стадии, может быть опасен для жизни, а раннее выявление рака кожи, такого как меланома, указывает на высокие шансы на выживание. Настоящая работа основывалась только на асимметрии, границе, цвете и диаметре [29].
2.3. Зерновые культуры
В условиях непрерывного роста населения пищевая промышленность должна постоянно наращивать объемы производства, одновременно повышая качество продукции. Для повышения производительности необходимы улучшения в производственной цепочке. Одним из таких достижений является автоматизация классификации зерновых культур, которая в последние годы привлекает к себе много внимания, поскольку были предложены новые методы автоматической классификации.
Рис
Семена риса бывают разных размеров, цветов, форм, текстур и состава, которые часто трудно различить невооруженным глазом. Традиционные методы различения сортов риса в основном основаны на химических и полевых подходах, которые являются вредными, трудоемкими и сложными, и не подходят для сортировки и онлайн-измерений. В результате поиск неразрушающего, простого и быстрого подхода к классификации типов риса был бы чрезвычайно полезен.
В исследовании предлагается использовать PLSDA, PCA-BPNN и LS-SVM. Наконец, использование мультиспектральной визуализации в сочетании с хемометрическими методами для определения типов семян риса является особенно привлекательным методом, поскольку он неразрушающий, простой и быстрый, и не требует никакой подготовки [30] (рис. 6).

Рис. 6. Изображения сортов риса.
Определение качества риса может зависеть от различных факторов, таких как цвет, плотность, форма, размер, количество битых зерен и меловая текстура. Человеческий осмотр качества риса не является ни объективным, ни эффективным. Многие исследования использовали обработку изображений для оценки качества зерна.
Компьютерное зрение (CV) — это технология для осмотра и оценки, которая является быстрой, недорогой, последовательной и объективной. Используя многоклассовый SVM, автор предлагает машинный метод для сортировки рисовых зерен. Метод опорных векторов помог точно сортировать и классифицировать рисовые зерна (лучше, чем 86%) с низкими затратами. На основе полученных результатов можно определить, что метод был адекватен для категоризации и сортировки различных типов риса на основе их внутренних и внешних качеств [31] (рис. 7).

Рис. 7. Основные этапы сортировки и классификации риса [31].
Пшеница
Пшеница является ключевым источником пищи во всем мире и широко выращивается в большинстве стран. Она может адаптироваться к различным условиям обитания, включая как орошаемые, так и засушливые почвы. Для производства пшеницы требуется сертифицированное чистое зерно, и зерна не должны смешиваться с различными генотипами на протяжении всего производственного процесса.
В коммерческом плане для классификации пшеницы выделяют две группы: твердость зерна и внешний вид. В исследовании предлагается автоматизированный метод, который может точно классифицировать зерна пшеницы. Для этой цели проверяется точность DSIFT с помощью классификатора SVM. Сначала к признакам DSIFT применяется алгоритм k-средних для кластеризации, затем, путем генерации «мешка слов» из визуальных слов, фотографии представляются с помощью гистограмм характеристик. Предложенная методика достигает показателя 88,33% при проведении экспериментального исследования на конкретном наборе данных [32].
Для извлечения визуальных признаков зерен или предметов системы компьютерного зрения используют технологии обработки изображений. Компьютерное зрение и искусственный интеллект (ИИ) могут быть использованы для автономной оценки качества. В результате может быть создана быстрая беспилотная система с превосходной точностью для классификации зерен. Приведено базовое приложение на основе компьютерного зрения, которое использует искусственную нейронную сеть (ИНС) на основе многослойного перцептрона (MLP) для правильной классификации зерен пшеницы на хлебные или твердые [33] (рис. 8).

Рис. 8. Хлебная пшеница против твердой пшеницы [33]
Кукуруза
Для определения качества семян и их классификации в качестве важного критерия может использоваться чистота семян. Для классификации типов семян были получены гиперспектральные изображения в диапазоне от 400 до 1000 нм для 1632 семян кукурузы (17 сортов).
Точность классификации улучшилась при использовании метода объединения признаков на основе метода выбора длины волны MLDA. При этом модель классификации, основанная на подходе преобразования/уменьшения признаков MLDA, превзошла алгоритм последовательных проекций (SPA) с линейным дискриминантным анализом (LDA) (90,31%) и исключение неинформативных переменных с LDA (94,17%) по точности классификации, увеличившись на 2,74% по сравнению со средним спектром [34].
Кофе
Кофе является одной из важных товарных культур и широко потребляемым напитком в человеческой культуре благодаря высокому содержанию кофеина. Хуанг и Ли использовали сверточную нейронную сеть (CNN), известный метод глубокого обучения, для предварительной обработки фотографий сырых кофейных зерен, собранных с помощью технологии обработки изображений. CNN превосходно справляется с извлечением цвета и структуры из фотографий.
В результате мы можем быстро различать отличные и плохие изображения зерен, отличающиеся неполной чернотой, повреждениями и т. д. Авторы использовали собственную технологию для быстрого определения того, какие зеленые зерна являются отличными, а какие — плохими. Используя эту стратегию, время, затрачиваемое на ручной отбор кофейных зерен, может быть сокращено вдвое, а создание высококачественных кофейных зерен может быть ускорено. Модель на основе CNN для различения отличных и плохих кофейных зерен показала общую точность 93,343% при частоте ложноположительных результатов 0,1007 [35, 36] (рис. 9).

Рис. 9. Архитектура идентификации [ 35 ]
2.4. Производство
Применение искусственного интеллекта на основе машинного обучения обычно рассматривается как перспективная промышленная технология. Сверточные нейронные сети (CNN) и другие методы глубокого обучения (DL) эффективно применяются в различных приложениях компьютерного зрения в производстве. Технология глубокого обучения в последнее время достигла такого уровня, что может проводить категоризацию на уровне человека, а также предоставлять мощные аналитические инструменты для обработки больших объемов данных из производства [37, 38, 39].
Исследование предполагает использование сверточной нейронной сети (CNN) для классификации ориентации объектов с использованием синтетических данных. Полная оценка позиционирования производственных компонентов на основе синтетических данных может быть оправдана как жизнеспособная идея с потенциальными применениями в производстве. Несколько изображений с разрешением 3000 × 4000 пикселей были получены с помощью камеры, установленной на верстаке [40].
Функция автоматической категоризации дефектов сортирует дефектные фотографии по заранее определенным морфологическим категориям дефектов. Для сравнения полученной точности подхода автоматической категоризации дефектов с предложенным подходом были использованы изображения дефектов поверхности пластин, полученные с помощью СЭМ с реального производственного предприятия. Все аномалии были преобразованы в единое изображение размером 128 × 128 пикселей для эксперимента. Было создано четыре набора данных изображений дефектов [38]. Точность классификации предложенного автором подхода и коммерчески доступной традиционной системы АЦП составила 77,23% и 87,26% соответственно (рис. 10).

Рис. 10. Сравнение автоматизированной категоризации дефектов и предложенного метода [38]
Аддитивное производство, иногда называемое 3D-печатью, в последние годы пережило огромный рост, особенно в отношении оборудования и технологий, позволяющих производить различные металлические объекты. Сциме и Бьют [41] внедрили методы компьютерного зрения для производства, осуществляемого с использованием машин лазерного спекания порошкового слоя (LPBF).
Авторы выбрали стратегию машинного обучения вместо человеческого проектирования детекторов аномалий из-за присущей ей гибкости. В 100% случаев алгоритм способен с высокой точностью определить наличие нулевых аномалий. Наконец, в 89% случаев алгоритм способен точно обнаружить наличие аномалии. Этот метод является уникальным применением современных методов компьютерного зрения в аддитивном производстве.
2.5 Автономные транспортные средства
В результате последних достижений в этих областях различные методы искусственного интеллекта, машинного обучения и глубокого обучения приобрели популярность и получили дальнейшее развитие. Беспилотные автомобили — одно из таких применений, которое, как ожидается, окажет значительное и революционное влияние на общество и способы передвижения людей.
Однако для того, чтобы эти автомобили стали реальностью, они должны быть наделены способностью к восприятию и познанию, необходимыми для решения стрессовых ситуаций в реальной жизни, принятия правильных решений и совершения соответствующих и безопасных действий в любое время.
Автономные автомобили основаны на переходе от человекоцентрированной автономии к полностью компьютероцентрированной автономии, в которой система искусственного интеллекта транспортного средства регулирует и контролирует все функции управления, а участие человека требуется только тогда, когда это абсолютно необходимо [42, 43] (рис. 11).

Рис. 11. Уровни автоматизации по классификации SAE.
Обнаружение объектов
Данные с камеры поступают в модуль обнаружения объектов камеры. Если встроенные вычислительные мощности достаточны, данные каждой камеры анализируются собственным детектором объектов; однако, если ресурсы ограничены, к изображениям, полученным путем объединения кадров с нескольких камер, применяется модель глубокой нейронной сети, которая в настоящее время представляет собой архитектуру YOLOv3 (модель обнаружения объектов в реальном времени).
Идентификация объектов с помощью «RADAR» потенциально может быть выполнена с использованием модели глубокой нейронной сети, которая может распознавать движущиеся точки и кластеры. В SS-DNN полученные изображения обрабатываются как детектором объектов, так и камерой, однако каждому пикселю в кадре присваивается метка. Вышеуказанные шаги необходимы для определения подвижности автомобиля, а также частей дорожной разметки и дорожных знаков, которые необходимо удалить для классификаторов на основе CNN. Искусственные нейронные сети восприятия используются для построения трех отдельных карт окружения транспортных средств на основе собираемых ими данных [44] (рис. 12).

Рис. 12. Модули
Обнаружение пешеходов
Способность беспилотного автомобиля автоматически и надежно распознавать пешеходов имеет решающее значение. Информация собирается во время движения по городским улицам. В общей сложности было получено 58 последовательностей данных за почти 3 часа движения по городским улицам в течение нескольких дней и в различных условиях освещения. Всего получено 4330 кадров. Автор разработал и изготовил уникальный испытательный стенд для сбора данных по обнаружению пешеходов на дороге. Благодаря этой конструкции система сбора данных на борту испытательного автомобиля теперь может быть мобильной.
В данном исследовании сравниваются только алгоритмы HOG и CCF для обнаружения пешеходов. Для обнаружения на нескольких уровнях масштаба признаки HOG интегрированы с SVM и методом скользящего окна. CCF использует низкоуровневую информацию из предварительно обученной модели CNN, каскадно соединенной с моделью бустинга леса, такой как Real AdaBoost, в качестве классификатора.
Набор данных содержит 58 размеченных видеопоследовательностей. Автор использовал 39 для обучения, а остальные 19 — для тестирования. Экспериментальные результаты показывают, что CCF значительно превосходит признаки HOG. В подходе CCF использование тепловых и цветных изображений в сочетании привело к пиковой производительности, обеспечивающей 9% логарифмически-средний процент ошибок [45].
Обнаружение полосы движения
Восприятие, планирование и управление — три основных элемента технологии беспилотных автомобилей. Цель данного исследования — создать и протестировать алгоритм восприятия, использующий данные с камер и компьютерное зрение для помощи автономным автомобилям в восприятии окружающей среды. Камеры — наиболее близкие к тому, как люди видят окружающую среду, а компьютерное зрение лежит в основе алгоритмов восприятия. Хотя лидарные и радарные системы используются в разработке технологий восприятия, камеры предоставляют нам мощный и менее дорогой способ получения информации об окружающей среде.
В данной работе рассматривается эффективный метод распознавания полосы движения, который позволяет оценить безопасную зону движения перед автомобилем [46]. Затем, используя перспективные преобразования и анализ гистограмм, автор представляет улучшенный подход к обнаружению полосы движения, который преодолевает ограничения минималистского подхода к обнаружению полосы движения [47]. С помощью этого подхода также можно обнаружить как прямые, так и изогнутые участки дороги.
3. Ограничения и проблемы
Выбор правильного алгоритма и поиск подходящего набора данных могут быть сложными задачами в компьютерном зрении. Недообучение и переобучение могут возникать в результате малого или большого количества наборов данных. Объем данных, необходимых для повышения точности даже на небольшую величину, огромен. Большая часть реальных данных не размечена, и на разметку данных тратится много усилий. Для обработки фотометрических наборов данных компьютерному зрению требуется больше вычислительной мощности. В результате низкого качества камеры могут возникнуть различные ограничения [48].
4. Заключение
Технология компьютерного зрения может быть эффективно внедрена в отраслях, зависящих от изображений и видеоинформации. Многие отрасли внедряют ИИ для выведения своего бизнеса на новый уровень, и для них компьютерное зрение является движущей силой. В данном обзоре представлены возможности компьютерного зрения в астрономии, медицине, пищевой промышленности, обрабатывающей промышленности и беспилотных автомобилях. Алгоритмы и методы, подходящие для каждой отрасли, послужат полезным руководством для исследователей, работающих в этой области. Компьютерное зрение используется не только для классификации объектов на Земле, но и во Вселенной за пределами земной атмосферы. Цель данного исследования — предложить вдохновляющую карту для внедрения компьютерного зрения в широком спектре отраслей.
Литература
- Hirschberg, J., Manning, C.D.: Advances in natural language processing. In: A Companion to Cognitive Science, pp. 226–234 (2008). https://doi.org/10. 1002/9781 405164535.ch14
- Balakrishnan, S., Janet, J.: Artificial intelligence and robotics: a research overview (2020) Google Scholar
- Zhang, X., Peng, Y., Xu, X.: An overview of speech recognition technology. In: Proceedings of the 2019 4th International Conference on Control, Robotics and Cybernetics (CRC), pp. 81–85 (2019). https://doi.org/10.1109/CRC.2019.00025
- Feng, X., Jiang, Y., Yang, X., et al.: Computer vision algorithms and hardware implementations: a survey. Integration 69, 309–320 (2019). https://doi.org/10.1 016/j.vlsi.2019.07.005 Article Google Scholar
- Nadkarni, P.M., Ohno-Machado, L., Chapman, W.W.: Natural language processing: an introduction. J. Am. Med. Inform. Assoc. 18, 544–551 (2011). https://doi.org/10 .1136/amiajnl-2011-000464
- Niemueller, T., Widyadharma, S.: Artificial intelligence—an introduction to robotics. Artif. Intell. 1–14 (2003) Google Scholar
- Gaikwad, S.K., Gawali, B.W., Yannawar, P.: A review on speech recognition technique. Int. J. Comput. Appl. 10, 16–24 (2010). https://doi.org/1 0.5120/1462-1976 Article Go ogle Scholar
- Khan, A.A., Laghari, A.A., Awan, S.A.: EAI endorsed transactions machine learning in computer vision: a review. 1–11 (2021) Google Scholar
- Badue, C., Guidolini, R., Carneiro, R.V., et al.: Self-driving cars: a survey. Expert Syst. Appl. 165, 113816 (2021). https://doi.org/10.1016/j.eswa.2020.113816 Article Google Scholar
- Ball, N.M., Brunner, R.J., Myers, A.D., Tcheng, D.: Robust machine learning applied to astronomical data sets. I. Star-galaxy classification of the Sloan Digital Sky Survey DR3 using decision trees. 497–509 Google Scholar
- Ball, N.M., Loveday, J., Fukugita, M., et al.: Galaxy types in the Sloan Digital Sky Survey using supervised artificial neural networks. 1046, 1038–1046 (2004). https://doi.org/10.1111/j.1365-2966.2004.07429.x
- Kardovskyi, Y., Moon, S.: Automation in construction artificial intelligence quality inspection of steel bars installation by integrating mask R-CNN and stereo vision. Autom. Constr. 130, 103850 (2021). https://doi.org/10.1016 /j.autcon.2021.103850 Article G oogle Scholar
- Odewahn, S.C., Nielsen, M.L.: Star-galaxy separation using neural networks. 38, 281–286 (1995) Google Scholar
- Hanocka, R., Liu, H.T.D.: An introduction to deep learning. In: ACM SIGGRAPH 2021 Courses, SIGGRAPH 2021, pp. 1438–1439 (2021). https://doi.org/10.1145 /3450508.3464569
- Chai, J., Zeng, H., Li, A., Ngai, E.W.T.: Deep learning in computer vision: a critical review of emerging techniques and application scenarios. Mach. Learn. Appl. 6, 100134 (2021). https://doi.org/10.1016/j.mlwa.2021.100134 Article Google Scholar
- Abiodun, O.I., Jantan, A., Omolara, A.E., et al.: State-of-the-art in artificial neural network applications: a survey. Heliyon 4, e00938 (2018). https://doi.org/10.1016/j. heliyon.2018.e00938 Article Google Scholar
- Weir, N.: Automated star/galaxy classification for digitized POSS-II. 109, 2401–2414 (1995) Google Scholar
- Odewahn, S.C., Stockwell, E.B., Pennington, R.L., et al.: Automated star/galaxy discrimination with neural networks 103, 318–331 (1992) Google Scholar
- Ball, N.M., Brunner, R.J.: Data mining and machine learning in astronomy (2010) Google Scholar
- Reza, M.: Galaxy morphology classification using automated machine learning. Astron. Comput. 37,(2021). https://doi.org/10.1016/j.ascom.2021.100492
- Peng, N., Zhang, Y., Zhao, Y., Wu, X.: Selecting quasar candidates using a support vector machine classification system 1 introduction. 2609, 2599–2609 (2012). https://doi.org/10.1111/j.1365-2966.2012.21191.x
- Zheng, H., Zhang, Y.: Review of techniques for photometric redshift estimation. Softw. Cyberinfrastruct. Astron. II 8451, 845134 (2012). https://doi.org/10.1117/12.925314 Article Google Scholar
- Firth, A.E., Lahav, O., Somerville, R.S.: Estimating photometric redshifts with artificial neural networks 2 artificial neural networks. 1202, 1195–1202 (2003) Google Scholar
- Richards, J.W., Starr, D.L., Butler, N.R., et al.: On machine-learned classification of variable stars with sparse and noisy time-series data. Astrophys. J. 733,(2011). https://doi.org /10.1088/0004-637X/733/1/10
- Upadhyay, P.K., Rastogi, S., Kumar, K.V.: Coherent convolution neural network based retinal disease detection using optical coherence tomographic images. J. King Saud. Univ. – Comput. Inf. Sci. (2022). https://doi.org/10.1016/j.jksuci.2021.12.002 Article Google Scholar
- Zemmal, N., Azizi, N., Sellami, M., et al.: Robust feature selection algorithm based on transductive SVM wrapper and genetic algorithm: application on computer-aided glaucoma classification. Int. J. Intell. Syst. Technol. Appl. 17, 310–346 (2018). https://doi.org/10.1504/IJISTA.2018.094018 Article Google Scholar
- Chakraborty, S., Mali, K.: A radiological image analysis framework for early screening of the COVID-19 infection: a computer vision-based approach. Appl. Soft Comput. 119, 108528 (2022). https://doi.org/10.1016/j.asoc.2022.108528 Article Google Scholar
- Maity, M., Mungle, T., Dhane, D., Maiti, A.K., Chakraborty, C.: An ensemble rule learning approach for automated morphological classification of erythrocytes. J. Med. Syst. 41(4), 1–14 (2017). https://doi.org/10.1007/s10916-017-0691-x Article Google Scholar
- Cueva, W.F., Muñoz, F., Vásquez, G., et al.: Detection of skin cancer “Melanoma” through computer vision. pp. 1–4 (2017) Google Scholar
- Liu, W., Liu, C., Ma, F., Lu, X., Yang, J., Zheng, L.: Online variety discrimination of rice seeds using multispectral imaging and chemometric methods. J. Appl. Spectrosc. 82(6), 993–999 (2016). https://doi.org/10.1007/s10812-016-0217-1 Artic le Google Scholar
- Kaur, H., Singh, B.: Classification and grading rice using multi-class SVM. 3, 1–5 (2013) Google Scholar
- Olgun, M., Okan, A., Özkan, K., et al.: Wheat grain classification by using dense SIFT features with SVM classifier. 122, 185–190 (2016). https://doi.org/10.1016/j. compag.2016.01.033
- Sabanci, K., Kayabasi, A., Toktas, A.: Computer vision-based method for classification of the wheat grains using artificial neural network (2017) Google Scholar
- Xia, C., Yang, S., Huang, M., et al.: Maize seed classification using hyperspectral image coupled with multi-linear discriminant analysis. Infrared Phys. Technol. 103077 (2019). https://doi.org/10.1016/j.infrared.2019.103077
- Huang, N., Chou, D.-L., Lee, C.: Real-time classification of green coffee beans by using a convolutional neural network. In: 2019 3rd International Conference on Imaging, Signal Processing and Communication, pp. 107–111 Google Scholar
- Huang, N., Chou, D.-L., Wu, F.-P., et al.: Smart agriculture real‐time classification of green coffee beans by using a convolutional neural network (2020) Google Scholar
- Krizhevsky, A., Sutskever, I.: ImageNet classification with deep convolutional neural networks. In: Handbook of Approximation Algorithms and Metaheuristics, pp. 1–1432 (2007). https://doi.org/10.1201/9781420010749
- Imoto, K., Nakai, T., Ike, T., et al.: A CNN-based transfer learning method for defect classification in semiconductor manufacturing. IEEE Trans. Semicond. Manuf. 32, 455–459 (2019). https://doi.org/10.1109/TSM.2019.2941752 Article Google Scholar
- Wang, J., Ma, Y., Zhang, L., et al.: Deep learning for smart manufacturing: methods and applications. J. Manuf. Syst. 48, 144–156 (2018). https://doi.org/10.1016/j. jmsy. 2018.01.003 Article Google Scholar
- Manettas, C., Nikolaos, K.A.: Synthetic datasets for deep learning in computer-vision assisted tasks in manufacturing: a new methodology to analyze the functional and physical architecture of manufacturing existing pro. Procedia CIRP 103, 237–242 (2021). https://doi.org/10.1016/j.procir.2021.10.038
- Scime, L., Beuth, J.: Anomaly detection and classification in a laser powder bed additive manufacturing process using a trained computer vision algorithm. Addit. Manuf. 19, 114–126 (2018). https://doi.org/10.1016/j.addma.2017.11.009 Article Google Scholar
- Inagaki, T., Sheridan, T.B.: A critique of the SAE conditional driving automation definition, and analyses of options for improvement. Cogn. Technol. Work 21(4), 569–578 (2018). https://doi.org/10.1007/s10111-018-0471-5 Article Google Scholar
- Gupta, A., Anpalagan, A., Guan, L., Khwaja, A.S.: Deep learning for object detection and scene perception in self-driving cars: survey, challenges, and open issues. Array 10, 100057 (2021). https://doi.org/10.1016/j.array.2021.100057 Article Google Scholar
- Novickis, R., Levinskis, A., Science, C., et al.: Functional architecture for autonomous driving and its implementation (2020) Google Scholar
- Chen, Z., Huang, X.: Pedestrian detection for autonomous vehicle using multi-spectral cameras. IEEE Trans. Intell. Veh. 1 (2019). https://doi.org/10.1109/TIV.2019.2904389
- Muthalagu, R., Bolimera, A., Kalaichelvi, V.: Lane detection technique based on perspective transformation and histogram analysis for self-driving cars. Comput. Electr. Eng. 85, 106653 (2020). https://doi.org/10.1016/j.compeleceng.2020.106653 Article Google Scholar
- Assidiq, A.A.M., Khalifa, O.O., Islam, R., et al.: Real time lane detection for autonomous vehicles. 82–88 (2008) Google Scholar
- Khan, A.A., Laghari, A.A., Awan, S.A.: Machine learning in computer vision: a review. EAI Endorsed Trans. Scalable Inf. Syst. 8, 1–11 (2021). https://doi.org/10.4108/eai.21-4-2021.169418 Article Google Scholar
Авторы: Gaurav Singh, Parth Pidadi & Dnyaneshwar S. Malwad



