Компьютерное зрение (КЗ) предоставляет компьютерам возможность воспринимать, анализировать и понимать содержание изображений и видео. Области применения многочисленны и варьируются от медицинской диагностики до промышленного контроля качества и создания спецэффектов. КЗ использует различные технологии и методы для извлечения релевантной информации из большого количества изображений, полученных с помощью компонентов машинного зрения (МЗ).
В промышленности компьютерное зрение и машинное зрение обычно объединяются для надежной проверки высококачественной продукции, контроля качества и сбора данных. В этой статье мы сначала представляем КЗ и МЗ, уделяя особое внимание удобным инструментам искусственного интеллекта, которые могут быть использованы, таким как машинное и глубокое обучение, а также распространенным методам распознавания цвета.
Во-вторых, мы рассматриваем два промышленных применения искусственного зрения, в частности КЗ, в контроле качества в режиме реального времени, чтобы оценить их научную ценность на основе первичных результатов проведенных исследований. Наконец, мы критически проанализировали полученные результаты, чтобы выявить недостатки, дать рекомендации и открыть новые горизонты для будущих исследований.
Введение
В настоящее время методы компьютерного зрения (CV) продолжают приобретать беспрецедентное значение в наших повседневных приложениях. Тем не менее, согласно последнему отчету Gartner Hype Cycle 2023 [1], особенно в отношении инструментов искусственного интеллекта (AI), CV близко подходит к предельному плато производительности. Поэтому он, безусловно, получит значительное расширение в сфере промышленности. В настоящее время CV уже играет важную роль в промышленном секторе, в частности, предоставляя возможности автоматизированного контроля в рамках процедур контроля качества. Однако мир автоматизации становится все более сложным. Индустрия 4.0, Интернет вещей (IoT), облачные вычисления, ИИ, машинное обучение (ML) и многие другие технологии ставят перед пользователями и разработчиками систем машинного зрения серьезные проблемы при выборе правильной и наиболее подходящей системы для их соответствующих приложений [2].
Действительно, с быстрым развитием во многих областях, таких как методы машинного зрения (MV), датчики CMOS, встроенные MV, МО, глубокое обучение (DL), роботизированные интерфейсы, стандарты передачи данных и возможности MV, технология предлагает преимущества для производства на многих уровнях [3]. Действительно, новые методы MV создают новые возможности для приложений. Гиперспектральное зрение может предоставить информацию о химическом составе обрабатываемых материалов. Компьютерная визуализация позволяет комбинировать серию изображений различными способами, чтобы выявить детали, которые невозможно увидеть с помощью традиционных методов MV. Кроме того, поляризационные камеры могут отображать напряжения в материалах. Другие разработки в области MV позволяют повысить производительность, интеграцию и автоматизацию в обрабатывающей промышленности. Степень интеграции может варьироваться от помощи в ручной сборке до полной интеграции в производителей оригинального оборудования из-за высоких требований Индустрии 4.0.
Чтобы гарантировать безупречное удовлетворение клиентов, отрасль должна быть в состоянии внедрять инновации, ускоряться и постоянно совершенствоваться; но прежде всего она не должна терять свои активы. Если развитие отрасли не сопровождается развитием функции качества, этот кажущийся прогресс рискует нанести ущерб качеству продукции и, следовательно, клиентскому опыту. Мы не должны игнорировать «Качество 4.0», которое должно быть для «Индустрии 4.0» тем же, чем качество было для Индустрии 3.0. Следовательно, речь идет о переносе контроля качества с бумаги в облако, из предыдущего технологического поколения в нынешнее. Контекст может измениться, но цель должна оставаться прежней. Цифровые инструменты теперь позволяют организациям более непосредственно и лично взаимодействовать со своими подрядчиками, поставщиками и клиентами — всей их экосистемой. При этом следует помнить о росте, который может обеспечить ИИ в расширении возможностей бизнеса [4].
Для координации в режиме реального времени, взаимодействия с клиентами и оптимизированной отчетности новые технологии стали гарантией прочных отношений. Кроме того, благодаря эффекту домино, обеспечивается общее качество и предотвращение рисков. Человеческий контроль идеально подходит для качественной интерпретации сложной и неструктурированной сцены. Метромагнитный контроль превосходен в количественном измерении структурированной сцены благодаря своей скорости, точности и повторяемости. Например, на производственной линии система магнитного контроля может проверять сотни и даже тысячи деталей в минуту. Более того, такая система с соответствующей оптикой и разрешением камеры может легко проверять объекты, невидимые невооруженным глазом [5].
Далее, данное исследование направлено на предоставление научному сообществу обзора использования CV и MV в реальных промышленных приложениях. Остальная часть статьи организована следующим образом: в разделе 2 мы дадим общую информацию об искусственном интеллекте, CV, MV, а также об основных технологиях и методах, используемых в CV (таких как ML, DL, а также обнаружение и измерение цвета), а также расскажем о конструкции системы MV. Затем, в разделе 3, мы представим два промышленных применения CV и обсудим их результаты с критическим анализом. Первое применение предназначено для мониторинга качества в реальном времени, а второе – для контроля болтов и винтов. Наконец, в разделе 4 мы завершаем данное исследование, предлагая новые идеи относительно потенциальных направлений будущих исследований.
Предыстория
Искусственный интеллект (ИИ)
Искусственный интеллект (ИИ) — это раздел компьютерной науки, занимающийся разработкой интеллектуальных агентов, или автономных систем рассуждения, обучения и действия. С помощью ИИ были разработаны эффективные методы решения различных задач, от игр до медицинской диагностики. Создание алгоритмов машинного и глубокого обучения стало одним из наиболее значительных достижений в области искусственного интеллекта. Системы ИИ могут обучаться на основе данных, используя методы машинного и глубокого обучения, без необходимости их явного проектирования или программирования. Сегодня ИИ используется во многих приложениях, таких как производство,
Транспорт, здравоохранение, розничная торговля и обслуживание клиентов. В частности, в производственных приложениях, рассматриваемых в текущем исследовании, ИИ обеспечивает автоматизацию производственных процессов, повышение качества и прогнозирование технического обслуживания. Например, роботы, оснащённые ИИ, могут выполнять монотонную или опасную человеческую работу.
Компьютерное зрение (CV) Машинное зрение (MV)
CV — это раздел искусственного интеллекта, который позволяет компьютерам и системам извлекать значимую информацию из цифровых изображений или фотографий, видео и различных других визуальных входных данных, а затем действовать или рекомендовать на основе этой информации [6]. Кроме того, CV использует большой объем данных для выполнения анализа, приводящего к различению и последующему распознаванию изображений. Для этого CV использует один из самых эффективных типов алгоритмов МО, а именно DL; в частности, сверточные нейронные сети (CNN). Однако MV — это подмножество CV, которое относится к изучению методов и техник, с помощью которых системы искусственного зрения могут быть созданы и эффективно использованы в практических приложениях. Внедрение MV в промышленные процессы часто мотивируется желанием снизить затраты за счет повышения эффективности (и, следовательно, производительности), уменьшения количества ошибок (и, следовательно, повышения качества) или сбора данных. Не менее важно, что оно также может заменить отсутствие доступной квалифицированной рабочей силы или освободить рабочих от опасной, сложной или утомительной производственной деятельности.
В прошлом определение этого термина было несколько неясным, однако в последнее время «MV» де-факто в значительной степени стало пониматься как практическая реализация понимания изображений или, более конкретно, методов CV, помогающих решать практические промышленные задачи, включающие значительный визуальный компонент. Более недавний акцент на союзе между MV и ML, который так революционизировал дисциплину, стал возможным благодаря преобразующим разработкам в области ИИ и послужил приближению некоторых возможностей машинного зрения к человеческому зрению — давняя неудовлетворенная амбиция, существовавшая с первых дней CV еще в 1960-х годах [7]. Кроме того, в следующем подразделе мы опишем основные компоненты систем машинного зрения (MVS).
Проектирование МВС
Системы видеонаблюдения (MVS), предназначенные для производственных задач, таких как контроль качества, используют обработку изображений и работают на основе набора правил и параметров. Основными компонентами MVS являются освещение, оптика, датчики изображений, системы обработки изображений и коммуникации. Освещение освещает контролируемую деталь, благодаря чему её особенности становятся заметными и могут быть точно видны камерой (см. рис. 1). Оптика получает изображение и затем представляет его датчику в виде света. Датчик камеры MVC преобразует этот свет в цифровое изображение, которое отправляется на процессор для анализа.
Следовательно, мы можем разделить систему на три основных компонента: i) Освещение, ii) Захват изображения и iii) Обработка изображения. Системы освещения играют важную роль в качестве изображения, поскольку именно свет делает объекты видимыми, а соответствующее освещение визуальной задачи обеспечивает эффективное зрение. Переднее или заднее освещение – это две категории конфигураций освещения. Заднее освещение используется для выделения фона объекта, в то время как переднее освещение действует как освещение, сфокусированное на объекте, что позволяет улучшить идентификацию элементов внешней поверхности продукта. В дополнение к освещению лампами накаливания и флуоресцентным лампам также используются лазеры, рентгеновские трубки и инфракрасное освещение [8]. Кроме того, образцы рассматриваются и создаются изображения с помощью инструментов или датчиков захвата изображений. Сканеры, ультразвук, рентгеновские лучи и ближняя инфракрасная спектроскопия – вот некоторые из инструментов или датчиков, используемых для создания изображений.
Однако в машинном зрении датчики изображения часто представляют собой твердотельные приборы с зарядовой связью (ПЗС) или камеры, а в некоторых приложениях используются устройства с термоэлектронной трубкой. С появлением цифровых камер больше нет необходимости в отдельном компоненте для преобразования изображений, полученных с помощью ПЗС-камер, фотоаппаратов или других датчиков, в формат, понятный компьютерным процессорам. Благодаря разному разрешению фотографии с цифровых камер сохраняют свои характеристики с минимальным уровнем шума. Кроме того, компьютер используется для импорта и преобразования полученных или сделанных фотографий в цифровые изображения. Цифровые изображения, несмотря на то, что отображаются на экране в виде картинок, на самом деле являются числами, которые компьютер может считывать и преобразовывать в маленькие точки или компоненты изображения, представляющие реальные вещи [3]. Например, мы можем использовать их в качестве входных данных для систем аутентификации в различных областях, таких как разработанные в [9] и [10].

Рис. 1. Компоненты системы машинного зрения (СМЗ) (Источник: [8]).
Используемые технологии и методы в CV
В компьютерном зрении, благодаря применению алгоритмических моделей, технологии машинного обучения (ML) и глубокого обучения (включая сверточные нейронные сети) позволяют компьютеру самообучаться и понимать контекст визуальных данных, представленных на входе. Итак, какие же три основные технологии (ML, DL, сверточные нейронные сети) ускоряют развитие компьютерного зрении?
Машинное обучение (МО)
ML — это раздел ИИ и компьютерной науки, который фокусируется на разработке, анализе и внедрении автоматизированных методов, которые позволяют машине развиваться посредством процесса обучения. Эти методы на практике разрабатываются на основе алгоритмов. Действительно, алгоритмы ML можно в целом разделить на два типа: алгоритмы черного ящика и интерпретируемые. Поэтому при выборе алгоритма ML крайне важно учитывать уникальные требования приложения и найти баланс между «точностью» и «интерпретируемостью». Действительно, «алгоритмы ML черного ящика» часто довольно точны, но их трудно или невозможно понять. Обычно они разрабатываются с использованием сложных математических моделей и обучаются на огромных наборах данных. Алгоритмы черного ящика способны выдавать потрясающие результаты, но в ситуациях, когда критически важно понять, как принимаются решения, может быть сложно доверять им из-за их отсутствия интерпретируемости. Мы можем перечислить следующие алгоритмы черного ящика: i) алгоритмы DL, такие как CNN, рекуррентные нейронные сети и трансформаторы; ii) опорные векторные машины; iii) случайный лес; iv) машины градиентного бустинга; v) метод K-ближайших соседей; и vi) наивный байесовский алгоритм.
Напротив, «интерпретируемые алгоритмы МО» просты для понимания и интерпретации людьми. Обычно они разрабатываются с использованием менее сложных математических моделей, использующих меньшие наборы данных. Несмотря на то, что интерпретируемые алгоритмы часто менее точны, чем алгоритмы «черного ящика», они более надежны в приложениях, где интерпретируемость имеет решающее значение, например, в финансовой и медицинской диагностике для лиц, принимающих решения. Например, этот тип алгоритмов включает в себя правила ассоциации классов (CAR) и регуляризованные правила ассоциации классов (RCAR) [11][12]. По сравнению с алгоритмами «черного ящика» они часто менее точны, но они больше подходят для приложений, где важно понимать обоснование решений, таких как финансы, безопасность и медицина. По сравнению с CAR, RCAR показывает высокую производительность и точность в нескольких областях, особенно в области кибербезопасности, когда дело доходит до профилирования и предотвращения атак безопасности [13][14].
Глубокое обучение (ГО)
DL — это подмножество ML, в котором задачи разбиваются и распределяются по алгоритмам ML, организованным в последовательные слои. Каждый слой накапливает выходные данные предыдущего слоя. Вместе слои составляют искусственную нейронную сеть, которая имитирует распределенный подход к решению задач, осуществляемый нейронами в человеческом мозге [7]. DL включает в себя CNN как подмножество. Таким образом, CNN — это алгоритм DL, но не всегда наоборот! Более того, CNN чаще используются для задач классификации и CV. Разбивая изображения на пиксели с метками или тегами, CNN помогает модели ML или DL «видеть». Свёртки — это математическая операция над двумя функциями, которая приводит к третьей функции. Она использует метки для выполнения свёрток и предсказывает то, что она «видит». Пока предсказания не начнут сбываться, нейронная сеть многократно проводит свёртки и оценивает точность своих предсказаний. Затем она идентифицирует или видит изображения подобно тому, как это делают люди [6].
Обнаружение и измерение цвета
Чтобы лучше понять, как работает обнаружение цвета при обработке изображений, мы взяли пример CV в измерении цвета продуктов питания. Цвет является первым качественным атрибутом продуктов питания, оцениваемым потребителями. Мы систематически думаем: «Этот желтый десерт будет иметь приятный ванильный вкус, или это мясо приятного красного цвета, что означает свежесть». В результате быстрое измерение цвета продуктов питания требуется для контроля качества продуктов питания. Человеческий глаз различает цвета в соответствии с различной чувствительностью различных колбочек в сетчатке к свету с разными длинами волн. У людей существует три типа цветовых фоторецепторных клеток (колбочек) с пиками чувствительности в коротких (голубоватых, 420–440 нм), средних (зеленоватых, 530–540 нм) и длинных (красноватых, 560–580 нм) длинах волн [15].
Цветовое ощущение, каким бы сложным оно ни было, можно описать с помощью трех цветовых компонентов, используемых глазами. Существует несколько способов кодирования цветов, но в этой статье мы представляем только один, чтобы иметь представление о кодификации цвета. Красный, зеленый, синий (RGB) — это формат кодирования цветов (см. рис. 2). Эти три цвета являются основными в аддитивном синтезе. Они приблизительно соответствуют трем длинам волн, на которые реагируют три типа колбочек человеческого глаза. Сложение этих трех дает человеческому глазу белый цвет. Они используются в освещении для получения всех цветов, видимых человеком. Сегодня они используются в видео, для отображения на экранах и в экранах/программном обеспечении для обработки изображений [3]. У каждого из нас становится все больше и больше предметов, в основном цветных автомобилей, телефонов, ювелирных изделий и т. д. Но задумывались ли вы когда-нибудь, как мы оцениваем полученные цвета, как мы их «измеряем»? Действительно, в промышленности и в науке недостаточно просто сказать, что эти очки немного слишком синие по сравнению с другими. Прежде всего, поскольку каждый глаз индивидуален, один скажет, что он слишком синий, а другой, возможно, скажет, что видит на этом предмете оттенок зелёного. Вам следует знать, что в промышленности и науке мы предпочитаем быть более точными и можем «измерить» цвет. Можно упомянуть три метода измерения цвета: i) Визуальное измерение квалифицированным специалистом. ii) традиционные измерения с использованием колориметров и спектрометров; и iii) измерения CV [16].
Более того, для методов цветового пространства и калибровки цвета определённая организация цветов в сочетании с профилированием физического устройства позволяет получать воспроизводимые представления цвета. Как в аналоговом, так и в цифровом представлении цветовое пространство может быть произвольным, с конкретными цветами, назначенными набору физических цветовых образцов и соответствующим им названиям или номерам цветов. Цветовое пространство — это идентификатор, который сообщает нам, как будут интерпретироваться цвета, и выстраивает эти цвета вокруг определённой точки белого [17].

Рис. 2. Цветовая кодировка «Красный, зеленый, синий» (RGB).

Рис. 3. Схематическая компоновка системы (Источник: [18]).
Промышленное применение CV: результаты и критический анализ
Мониторинг качества в режиме реального времени при строительстве роботизированных зданий
В этом подразделе мы представим применение CV для мониторинга качества в реальном времени при роботизированном строительстве зданий. Для оценки производительности предлагаемой технологии путем экспериментов используется бетонный принтер лабораторного масштаба. Что касается сбора и обработки данных, для записи видео процесса экструзии используется камера Logitech 720p. Она надежно прикреплена к экструдеру с помощью напечатанного на 3D-принтере крепления таким образом, чтобы быть обращенной к верхней поверхности напечатанного слоя. Расстояние от объектива камеры до верхней поверхности экструдированного слоя фиксировано и составляет 40 см (рис. 3). Видео процесса экструзии обрабатываются в реальном времени с помощью Raspberry Pi 3 model B [18]. Кроме того, алгоритм CV, предложенный Каземяном и соавторами [18] на рис. 4, измеряет ширину свежеэкструдированного слоя и сравнивает ее с целевой шириной слоя для выявления условий переэкструзии или недоэкструзии. Переэкструзия может быть просто идентифицирована по увеличенной ширине слоя по сравнению с целевой шириной. Однако недостаточная экструзия может привести к трем различным последствиям: уменьшению ширины слоя, разрыву и нарушению сплошности экструдированного слоя или отсутствию осаждения.

Рис. 4. Предлагаемый алгоритм компьютерного зрения, предложенный А. Каземяном и др. [18].

Рис. 5. Готовое изображение процесса экструзии: а) Вид сверху; б) Соответствующее бинарное изображение (Источник: [18]).

Рис. 6. Дефект цвета (Источник: [20]).
Что касается алгоритма обработки видео, то принят подход, основанный на форме, а не на подходах, основанных на цвете и текстуре, которые обычно не обеспечивают надежных результатов для обнаружения тонких объектов. Для каждого теста выдавливания запись и обработка видео начинаются одновременно с процессом выдавливания. Цель состоит в том, чтобы подготовить более простое изображение для следующего шага обработки, затем изображение размывается с помощью фильтра Гаусса, и изображение преобразуется с помощью метода бинарного порогового значения для разделения фона (печатной платформы) и переднего плана (выдавленного слоя). Затем создается бинарное изображение, в котором «выдавленный слой» представлен в «белом цвете», а «фон» — в «черном цвете». Следующий шаг — обнаружение контурного изображения с помощью метода дискриминации формы, после нахождения и проверки контура слоя измеряется ширина слоя.
Для демонстрации применения данной технологии алгоритм CV, предложенный А. Каземяном и др. (см. рис. 4), используется для реализации системы экструзии с обратной связью управления для «контурного моделирования». Цель состоит в разработке системы экструзии, способной автоматически регулировать параметры экструзии таким образом, чтобы слой заданной ширины непрерывно экструдировался с использованием любой печатной смеси без необходимости предварительной калибровки и несмотря на некоторые изменения в печатном материале. Следовательно, необходимы дальнейшие исследования для повышения производительности такой системы экструзии с замкнутым циклом, основанной на машинном зрении, особенно в отношении алгоритма управления. Однако, будучи ранним исследованием, полученные результаты подтверждают возможность разработки экструдера с машинным зрением, который мог бы автоматически печатать слои заданных размеров с использованием любой печатной смеси без необходимости предварительной калибровки.
Системы CVS всегда являются лучшим решением, поскольку интегрированные системы MVS позволяют им реагировать и адаптироваться к происходящему вокруг и на выходе процесса. Полученные результаты продемонстрировали высокую точность и оперативность разработанной системы мониторинга экструзии в экспериментальных условиях. Использование одного компьютера с платой может ограничить производительность системы, поскольку она миниатюризирована. Разъёмы, которые часто являются причиной
Проблемы присутствуют в небольшом количестве в этих системах. Это повышает надежность, но делает ремонт сложным или невозможным. Возможно, с использованием встроенных компьютеров мы могли бы получать лучшие результаты за меньшее время, а также выполнять вычисления, которые улучшат качество экструзии за счет увеличения размера реализованного образца, поскольку встроенная система обычно управляет физическими операциями машины, в которую она встроена, она часто имеет вычислительные ограничения в реальном времени. Встроенные системы управляют многими устройствами, которые широко используются сегодня. Более того, для более качественного изображения при рендеринге в реальном времени мы можем дополнительно рассмотреть трехмерный (3D) гауссов сплэттинг для рендеринга поля яркости в реальном времени, разработанный Б. Керблом и др. [19].
Проверка болтов и винтов на производственной линии на основе CV
В этом подразделе мы представляем результаты исследования применения CV при контроле болтов и винтов, проведённого Дж. Раджаном и соавторами [20]. В результате камеры с искусственным интеллектом были использованы для получения изображения объекта, подлежащего проверке системой машинного зрения. «Аналоговое изображение» преобразуется в «цифровое» путём дискретизации и квантования. Предварительная обработка — это следующий этап, который подготавливает изображение к последующей обработке. Предварительно обработанное изображение используется в качестве отправной точки для процесса сегментации, который оптимизирует представление изображения в более приемлемый для обработки формат. В качестве аппаратного ускорения в исследовании использовался Intel Neural Compute Stick (NCS) для обработки контуров. Для создания языка программирования были объединены объектно-ориентированные языки программирования Python и C++, поскольку Python был создан именно для этого. Модуль камеры с «инфракрасными светодиодами», которые генерируют инфракрасное излучение и имеют внутреннюю фокусировку, используется для выявления дефектов в изделии. Хотя для создания аппаратного обеспечения использовался Solid Works.
Входные данные камеры преобразуются в двоичные данные для последующей обработки и аналогичны визуальным данным, которые обычно распознаются человеческим глазом. Вся эта процедура была выполнена на машине, оснащенной Intel NCS, датчиком зрения и микроконтроллером для хранения данных и выполнения связанной обязанности по выявлению дефектов. Небольшой и безвентиляторный гаджет, называемый Intel Neural Computing Stick, может быть использован для обучения программированию ИИ на периферии. «Микроконтроллер включен для задач IoT, которые могут быть выполнены на основе дефекта», – утверждают Джон Раджан и др. [20]. Кроме того, болты производственной линии принимаются камерой, когда они проходят под ней, анализируются далее системой, и дефектные болты идентифицируются и устраняются. Таким образом, мы можем разделить дефекты на три категории: i) Дефект цвета; ii) Дефект ориентации; и ii) Дефект трещины.
Фактически, проблемы с производственным процессом или ухудшение потока данных при использовании нейронной модели для обнаружения дефекта цвета на болте при его перемещении через зону контроля качества являются основными причинами дефектов цвета. Контуры формируются, и микроконтроллер подаёт сигнал для его выделения, когда дефект подтверждается как значение, превышающее пороговое (см. рис. 6). Однако одним из наиболее частых дефектов болтов является дефект ориентации. Разориентации болта можно обнаружить с помощью метода сверточных нейронных сетей [16]. Дефекты болта – это и есть дезориентация. Проблемные болты идентифицируются как имеющие проблемы с ориентацией, и они снимаются с конвейера. Некоторые трещины особенно сложно обнаружить традиционными методами, и это третий дефект – дефект трещины. Поток данных в виде изображения болта передается через нейронную модель для обнаружения излома при перемещении через зону контроля качества. Для уменьшения визуальных искажений изображение было преобразовано в оттенки серого. Чтобы сделать болт видимым, используется размытие. Для определения контуров и их сопоставления с общими данными используется функция обнаружения контуров. Обнаружение дефекта трещины является результатом изменения или несоответствия данных.
Подводя итог, можно сказать, что метод активного контура, используемый в данном приложении, представляет собой разновидность метода сегментации, обладающую некоторыми ограничениями. Во-первых, он часто застревает в состояниях локального минимума; это можно преодолеть, используя методы имитации отжига, что является причиной вычислительной сложности. Во-вторых, они часто упускают из виду мельчайшие особенности в процессе минимизации энергии по всему пути своих контуров. Третье ограничение заключается в том, что точность определяется критериями сходимости, используемыми в методе минимизации энергии. Таким образом, более высокая точность требует более строгих критериев сходимости и, следовательно, более длительного времени вычислений. Четвертый недостаток проявляется, когда размер изображения слишком велик, поэтому этот метод работает медленно. Два последних недостатка заключаются в том, что этот метод не способен сегментировать ближайшие объекты и не очень хорош для операций, связанных с видео.
Заключение
В этой статье мы представили обзор применения технологий искусственного интеллекта (таких как машинное/глубокое обучение и нейронные сети) и компьютерного зрения (КЗ) в промышленном контроле качества в режиме реального времени, рассмотрев два примера применения (мониторинг качества в режиме реального времени при роботизированном строительстве зданий и контроль болтов и винтов на производственной линии). Результаты показали, что КЗ уже является частью наших производственных процессов, улучшая наше восприятие контроля качества нашей продукции в режиме реального времени и позволяя нам более точно прогнозировать несоответствия и сокращать затраты. В связи с этим был проведен критический анализ результатов двух опытов применения КЗ в промышленности для выявления основных ограничений широко используемых в таких случаях методов и методик. Сегодня КЗ применяется в самых разных областях: от помощи оператору в выявлении несоответствующих деталей до помощи автономному мобильному роботу в его перемещениях и анализа поведения объектов в заданном пространстве. Действительно, со временем мы считаем необходимым проводить анализ реальных случаев, приближенных к уже индустриальным процессам, чтобы преодолеть ограничения будущих интеллектуальных систем зрения. Наши будущие направления работы включают исследование различных алгоритмов МО и ГО, используемых в CV, и их потенциального применения в случае производства автомобильных деталей для более эффективного контроля качества в реальном времени.
Литература
-
-
-
- M. Azmi, A. Mansour, C. Azmi. A Context-aware Empowering Business with AI: Case of Chatbots in Business Intelligence Systems. Procedia Computer Science (2023)
Forthcoming in ссылка
-
-
BM, What is computer vision? IBM topics (Accessed on Sept. 25, 2023). ссылка
-
Computers in Industry, 130 (2021), Article 103472, ссылка
-
International Journal of Computer Applications, 1 (4) (2010), pp. 1-9
-
-
-
-
-
Annals of Telecommunications (2023), pp. 1-27
-
-
-
-
-
-
-
Materials Today: Proceedings, 45 (2021), pp. 6931-6935.
Авторы: Abdelfatah Ettalibi, Abdelmajid Elouadi, Abdeljebar Mansour



