Данная статья адресована специалистам, интересующимся применением компьютерного зрения в производственной или горнодобывающей сфере.
В частности, информация будет полезна руководителям, представителям отделов контроля качества, менеджерам проектов, технологам и другим лицам, принимающим решения в области автоматизации процессов.
Текст излагает принципы работы компьютерного зрения доступным языком, без чрезмерного использования. В статье рассматриваются основы технологии, движущие силы ее развития и преимущества по сравнению с альтернативными методами.
Просим вас уделить несколько минут чтению статьи для получения полезной информации о возможностях компьютерного зрения..
Что такое компьютерное зрение?
Попытаемся разобраться в сущности компьютерного зрения, используя доступный и понятный язык, свободный от сложных терминов и сложных технических деталей.
Для восприятия окружающего мира человек полагается на два основных инструмента: зрение и мозг. Зрение отвечает за сбор информации из внешней среды, а мозг – за ее обработку и интерпретацию.
Данный процесс даёт человеку возможность воспринимать и интерпретировать объекты, находящиеся в его непосредственной близости. Компьютерное зрение функционирует по схожему принципу.
Ключевое отличие заключается в том, что вместо зрительных органов может использоваться любой источник визуальной информации, такой как видеокамера или фотоаппарат. Роль мозга выполняет компьютерная система с обученной нейронной сетью.

Компьютерное зрение представляет собой более развитую модель восприятия окружающей среды по сравнению с человеческим зрением.
Камеры способны фиксировать детали, которые ускользают от внимания человека, как по скорости обработки информации, так и по объему воспринимаемых данных (в то время как человек обычно концентрируется на одном объекте).
Тем не менее, существенным ограничением является то, что нейросети способны интерпретировать лишь ту информацию, с которой были предварительно ознакомлены в процессе обучения.
Принцип обучения нейросети в компьютерном зрении?
Чтобы постичь принципы функционирования компьютерной обработки изображений, необходимо рассмотреть, каким образом компьютер в целом воспринимает и интерпретирует визуальную информацию.
Для лучшего понимания данного процесса, рассмотрим иллюстративный пример. Возьмем для анализа изображение цифры “8”.

Если его приблизить, то мы обнаружим, что оно состоит из множества небольших квадратных блоков. Их называют пиксели.

Как следует из предоставленного изображения, каждый элемент изображения (пиксель) характеризуется индивидуальной степенью окраски и интенсивностью черного цвета.
Область вокруг цифры “8” представлена черным цветом. Внутри цифры наблюдаются светлые пиксели белого и серого оттенков.
Шкала градаций черного цвета варьируется от 0 до 255, где 0 соответствует абсолютно черному цвету, а 255 – белому.
Для лучшего понимания предлагается визуализировать эти градации непосредственно на изображении.

Передача изображения компьютеру позволяет ему проанализировать различия в яркости (черный и белый цвета) для определения границ объектов и расстояния между ними. Таким образом, компьютер может получить представление о форме объекта.
Следует отметить, что анализ цветных изображений более сложен. Вместо градаций черного и белого, пиксель содержит смесь трех цветов (RGB: красный, зеленый, синий), интенсивность которых варьируется от 0 до 255.
Рассмотрим пример обучения нейросети распознаванию автомобилей на фотографиях.
Для этого необходимо предоставить нейросети большой набор изображений с четкой маркировкой объектов (“это – автомобиль”).
Анализируя изображения поочередно, система выявляет закономерности, связывающие визуальные характеристики с идентификацией объекта.
Работа нейросети по распознаванию объектов: Пример с автомобилями и мотоциклами
В результате работы нейросеть формирует “профиль” объекта. Этот профиль представляет собой набор признаков, позволяющих нейросети идентифицировать изображение автомобиля на новой фотографии, которая не была включена в исходный набор данных.
Точность профиля напрямую зависит от объема входных данных (фотографий автомобилей). При увеличении количества изображений вероятность корректной идентификации автомобиля приближается к 100%.
Процесс обучения нейросети для распознавания автомобилей и мотоциклов осуществляется в несколько этапов:
1. Подготовка данных.
На этом этапе собирается и маркируется обширный набор фотографий автомобилей и мотоциклов. Каждая фотография сопровождается четкой аннотацией, указывающей тип изображенного объекта.
2. Разделение данных.
Собранные изображения делятся на две категории: обучающую и тестовую. Обучающая выборка используется для непосредственного обучения нейросети, а тестовая – для оценки ее точности.
3. Обучение.
Нейросеть анализирует обучающую выборку, выявляя закономерности и связи между изображениями. На основе этой информации она формирует профили автомобиля и мотоцикла.
4. Тестирование.
После завершения обучения нейросеть тестируется на тестовой выборке. Результаты тестирования позволяют оценить эффективность обучения и принять решение о необходимости внесения корректировок или окончании процесса.
Тенденции развития компьютерного зрения.
Несмотря на то, что передовые технологии могут демонстрировать впечатляющие результаты в контролируемых условиях, их внедрение в реальную практику сталкивается с различными ограничениями, как техническими, так и экономическими.
Компьютерное зрение служит ярким примером того, как технология может за короткий период времени закрепиться как эффективный инструмент для решения конкретных задач в различных отраслях.
Этот стремительный рост обусловлен рядом ключевых факторов:
1. Исключение ошибок, связанных с человеческим фактором:
В тех областях, где точность визуального анализа критична, компьютерное зрение может заменить человека, поскольку оно не подвержено усталости, ошибкам внимания и другим человеческим ограничениям.
2. Высокая скорость обработки информации:
Компьютерное зрение способно анализировать визуальную информацию с высокой скоростью и точностью, превосходя возможности человека.
3. Возможность применения в опасных зонах:
В ситуациях, представляющих угрозу для здоровья и безопасности человека, компьютерное зрение позволяет проводить визуальный осмотр без риска для сотрудников.
4. Применение в сложных условиях:
Современные системы компьютерного зрения способны работать в широком диапазоне температур, условий освещения и присутствия помех, таких как пыль, что делает их применимыми в различных средах.
5. Немедленная реакция на события:
Компьютерное зрение обеспечивает мгновенную реакцию на изменения и отклонения, в то время как человеческий фактор может приводить к задержкам и ошибкам.
6. Широкий спектр применения:
Постоянно расширяющееся поле применения компьютерного зрения открывает новые возможности для его использования в различных отраслях.
Популярность технологии растет, о чем свидетельствует увеличивающийся интерес к ней, подтвержденный данными поисковых запросов.

Применение компьютерного зрения.
В настоящем разделе будут представлены примеры практического применения компьютерного зрения.
При ознакомлении с материалами предлагается задуматься о возможности использования данной технологии в вашей профессиональной сфере или на вашем предприятии.
1. Контроль качества и обнаружение дефектов.

На промышленных предприятиях неизбежно появление дефектной продукции. Это одна из главных проблем, с которой сталкиваются руководители, технологи и специалисты по контролю качества.
К числу таких дефектов относятся:
- Поверхностные повреждения (царапины);
- Нарушения геометрических параметров изделий;
- Отсутствие маркировки или иных необходимых элементов;
- Присутствие посторонних включений и т.д.
Интеграция в производственный процесс камер с нейросетевым анализом на одном из этапов позволяет своевременно выявлять подобные дефекты. В зависимости от заданных параметров, система может остановить конвейер, подать световой или звуковой сигнал, либо перенаправить бракованную продукцию по отдельному пути.
Все обнаруженные дефекты регистрируются и сохраняются в отчете.
2. Проверка использования СИЗ

С помощью камер можно выявлять любые нарушения связанные с отсутствием средств индивидуальной защиты на предприятии, стройке и т.п. Определять можно, например, одел рабочий маску, каску, очки, перчатки или нет.
3. Подсчет количества людей.

Компьютерное зрение находит применение в решении ряда практических задач. К числу таких задач относятся:
- Анализ людского трафика: Определение количества посетителей в торговых центрах и магазинах, что позволяет проводить маркетинговые исследования и оптимизировать работу заведения.
- Мониторинг пассажиропотока в транспорте: Подсчёт пассажиров в различных видах транспорта с целью анализа доходности маршрутов, оптимизации расписания и предотвращения хищений со стороны водителей.
Данные, полученные с помощью компьютерного зрения, способствуют повышению эффективности и прозрачности работы предприятий и организаций.
4. Вычисление веса, объема, габаритов
5. Гранулометрия в добывающей промышленности.
Системы машинного зрения, реализующие анализ гранулометрического состава в режиме реального времени, уже внедрены и успешно эксплуатируются в предприятиях горнодобывающей отрасли.
Данные системы обеспечивают точное измерение и классификацию гранул в осадочных породах с разрешением до 0,0125 мм, а также обнаружение искончатых включений и негабаритных элементов.
6. Анализ урожая и сортировка плодов в сельском хозяйстве

Компьютерное зрение получило широкое распространение в сельскохозяйственной отрасли.
Беспилотные летательные аппараты (дроны), оснащенные камерами, используются для мониторинга состояния почвы и сельскохозяйственных культур на обширных территориях. Системы, обученные распознавать плоды, применяются не только для сортировки овощей, ягод и фруктов, но и для выявления дефектов, заболеваний растений и бракованной продукции.
Помимо отбраковки некондиционных продуктов, такие системы способны прогнозировать объемы будущих урожаев и сигнализировать о необходимости принятия своевременных мер в случае риска их недополучения, что позволяет обеспечить своевременное вмешательство.
7. Применение в медицине.

Нейросети обладают способностью выявлять детали, которые могут быть упущены человеческим глазом.
Их применение в медицине, особенно в анализе изображений, таких как рентгеновские снимки, томограммы и видеоколоноскопия, приобретает всё большую актуальность. Эти системы способны эффективно обрабатывать массивы данных и выявлять даже незначительные отклонения, что способствует ранней и точной диагностике заболеваний.
Таким образом, нейросети выступают в роли ценного помощника врача, предоставляя ему непрерывную поддержку и повышая эффективность диагностики.
8. Идентификация разных объектов
Нейронные сети обладают способностью к обучению распознаванию практически любых объектов с точностью до 99%. Это делает компьютерное зрение эффективным инструментом для решения задач, требующих идентификации объектов, запечатленных камерой.
В качестве примера можно привести внедрение компанией “Магнит” умных весов для овощей и фруктов. Интегрированная в весы камера и нейросеть позволяют автоматически определять тип продукта, исключая необходимость ручного поиска.
9. Предотвращение краж.

Нейронные сети обладают способностью выявлять детали, которые могут быть упущены человеческим глазом.
В частности, технологии компьютерного зрения эффективно применяются в медицинской диагностике, например, при анализе рентгеновских снимков, томографических данных и видеозаписей колоноскопии.
Благодаря способности обрабатывать огромные объемы информации, эти системы способны обнаружить даже незначительные аномалии, что способствует ранней и более точной постановке диагноза.
Таким образом, нейросети выступают в роли надежного помощника для врачей, обеспечивая непрерывный и высокоточный анализ медицинских данных.
10. Внедрение в автомобили.

Данная технология обладает высоким потенциалом развития в будущем. Благодаря использованию камер с компьютерным зрением и датчиков, система способна идентифицировать и анализировать окружающую среду.
Это способствует повышению безопасности дорожного движения, а также упрощению и оптимизации процесса парковки.
В настоящее время разрабатывается следующий этап – создание транспортных средств, способных к автономному управлению. Существуют прототипы подобных систем, демонстрирующие свою функциональность.
11. Распознавание лиц

Наиболее распространённое применение компьютерного зрения связано с распознаванием лиц.
Данная технология находит широкое применение в различных областях:
- Сфера безопасности: Идентификация лиц для контроля доступа, выявления подозреваемых.
- Обработка видеоматериалов: Автоматический анализ видео для поиска определенных лиц или событий.
- Пропускные системы: Биометрическая аутентификация на основе распознавания лиц.
- Банковская сфера: Верификация личности клиентов, предотвращение мошенничества.
- Безопасность онлайн-учета: Использование биометрии лица в качестве пароля для доступа к аккаунтам.
- Бесконтактные платежи: Подтверждение личности покупателя при оплате товаров и услуг.
- Фото- и видеосъемка: Автоматическая фокусировка, распознавание лиц для улучшения качества изображения.
12. Роботизированная сборка на производстве.
Применение компьютерного зрения в области повышения производительности и автоматизации сборки демонстрирует значительный экономический потенциал.
Данная технология позволяет оптимизировать производственный процесс за счет исключения участия manusia (соответственно, сокращая затраты на оплату труда), а также повысить качество конечной продукции путем минимизации брака и ускорения процесса сборки.
13. Распознавание текста.

Применение компьютерного зрения в области повышения производительности и автоматизации сборки демонстрирует значительный экономический потенциал.
Данный подход позволяет оптимизировать производственный процесс за счет исключения необходимости ручного труда, что ведет к сокращению затрат на оплату труда. Кроме того, использование компьютерного зрения способствует повышению качества продукции путем минимизации брака и ускорения процесса сборки.
Плюсы и минусы внедрения машинного зрения.
Преимущества:
- Усиление контроля качества продукции. Система позволяет более тщательно отслеживать качество на всех этапах производства.
- Интеграция без модификации оборудования. Внедрение системы не требует существенных изменений в существующей производственной инфраструктуре.
- Минимизация брака. Благодаря точной диагностике дефектов, система способствует снижению количества бракованной продукции.
- Непрерывное функционирование. Система способна работать круглосуточно, без перерывов на выходные и праздники, что повышает общую эффективность производства.
- Повышение производительности. Автоматизация процессов ведет к увеличению объема выпускаемой продукции в единицу времени.
- беспечение безопасности сотрудников. Система может выполнять задачи в опасных для человека зонах, минимизируя риск получения травм.
Недостатки:
- Требовательность к освещению. Для эффективной работы системы необходимо обеспечить достаточное освещение рабочей зоны.
- Высокая стоимость оборудования для скоростных линий. Использование системы на высокоскоростных производственных линиях может потребовать значительных капиталовложений.
- Необходимость предварительного обучения. Перед началом эксплуатации системы требуется проведение специального обучения персонала.
- Рост затрат при обнаружении новых дефектов. Каждый новый тип дефекта, который необходимо выявить, влечет за собой дополнительные расходы на доработку и настройку системы.
Сколько стоит внедрение машинного зрения?
Рассмотрим вопрос ценообразования систем компьютерного зрения, который является одним из ключевых факторов при принятии решения об их внедрении.
Стоимость системы складывается из нескольких основных компонентов:
- Аппаратное обеспечение: Видеокамеры, осветительные приборы и монтажные конструкции. Выбор камер зависит от требований к скорости обработки изображения и разрешению. Широкие зоны охвата или необходимость многостороннего обзора объекта могут потребовать установки нескольких камер, что увеличит затраты. Качество освещения также играет важную роль и требует установки соответствующего оборудования. Дополнительные расходы могут возникнуть при необходимости монтажа конструкций для размещения оборудования.
- Обучение нейросети: Этот процесс занимает от 2 до 8 месяцев и зависит от объема обучающих данных (изображений или фотографий).
- Программное обеспечение: На рынке доступны готовые системы, оптимизированные для конкретных задач и отраслей. Использование таких решений является более экономичным по сравнению с разработкой индивидуального программного обеспечения.
- Сервер: Цена сервера определяется требованиями нейросети к вычислительным ресурсам. Дополнительные факторы, такие как влаго- и пылезащищенность, также влияют на стоимость.
В дополнение к перечисленным элементам, необходимо учитывать затраты на пуско-наладочные работы, оценку проекта и проектирование.
Стоимость внедрения системы компьютерного зрения может варьироваться от 4 до 25 миллионов рублей в зависимости от сложности задачи. Для получения точной оценки бюджета рекомендуется обратиться к специалистам с подробным описанием поставленной задачи.
Пример реально работающей системы машинного зрения
В основе данной системы лежит применение высокоскоростных камер, монтируемых над конвейерной лентой в тех зонах, где требуется идентификация дефектов. Выбор камер осуществляется с учетом скорости движения конвейера и минимальных размеров выявляемых дефектов. Современные установки способны функционировать при скорости конвейера до 50 метров в секунду и обнаруживать дефекты площадью до 0,0125 квадратных миллиметров.
Обработка видеопотока осуществляется на сервере с установленной программой “ML Sense”. Эта программа анализирует поступающий с камер видеосигнал, используя алгоритмы машинного зрения для определения бракованных изделий и передачи данных в информационную систему предприятия и приложение оператора.
Приложение оператора информирует о событии обнаружения дефекта, предоставляя данные о времени события, характеристиках брака (площадь, размеры, положение и расстояние от заданной точки), что позволяет оператору принять решение об отбраковке. Управление процессом контроля может осуществляться как со стационарного компьютера, так и с мобильных устройств на базе Android или iOS.
Система также способна работать в автономном режиме без участия оператора.
Интересный факт про компьютерное зрение
Первоначальные попытки разработки систем обнаружения объектов были предприняты в 1950-х годах. В тот период возможности таких систем ограничивались распознаванием простых геометрических фигур, таких как круг и квадрат.
Если перед Вами стоит похожая задача оставьте заявку на обратный звонок!
Наши специалисты перезвонят Вам в течение 1 часа в рабочее время и расскажут о возможности внедрения системы машинного зрения на Вашем производстве.