Машинное зрение в условиях плохой видимости: анализ проблемы и варианты ее решения

15
views

Машинное зрение, являющееся ключевым направлением в сфере искусственного интеллекта, позволяет компьютерным системам получать, обрабатывать и интерпретировать изображения реальных объектов. Ключевой особенностью этой технологии является способность к автоматическому распознаванию объектов, как полностью, так и частично, без прямого участия человека.

В последнее время особое внимание уделяется применению машинного зрения в условиях ограниченной видимости. Данная область исследований приобретает все большую актуальность с развитием автономных транспортных средств, систем видеонаблюдения и других областей, где низкая видимость может существенно снизить безопасность и эффективность работы.

В данной статье анализируются особенности использования машинного зрения на основе камерной и лидарной технологий. Исследование опирается на анализ научных данных, сравнительный анализ, синтез информации и графическую интерпретацию.

Основной целью исследования является изучение возможностей применения технологий машинного зрения в условиях плохой видимости. В результате проведенного анализа выявлены особенности внедрения лидарных технологий в системы машинного зрения.

Кроме того, статья определяет перспективы развития данной области и рассматривает актуальные направления исследований.

Введение

В области машинного зрения задачи, связанные с плохой видимостью, остаются актуальными и требуют дальнейшего изучения. Ученые активно разрабатывают новые алгоритмы и методики для повышения качества и эффективности систем компьютерного зрения в таких условиях.

Данная область исследований характеризуется поиском инновационных решений, направленных на улучшение работы систем машинного зрения при ограниченной видимости. Это может иметь существенное практическое значение в различных сферах, таких как автономное вождение, безопасность, медицина и промышленность.

Плохая видимость может быть вызвана различными факторами: недостаточным освещением, туманом, дымом, дождем или снегом. В таких условиях традиционные методы компьютерного зрения часто оказываются неэффективными.

Одним из перспективных направлений решения этой проблемы является применение методов машинного обучения. Предварительная обработка изображений с помощью фильтров и алгоритмов улучшения качества, а также использование глубоких нейронных сетей позволяют повысить четкость изображений и установить соответствие между размытыми или искаженными объектами и их वास्तвичами формами.

Несмотря на то, что некоторые алгоритмы машинного зрения могут быть применены в условиях плохой видимости, специфические проблемы, такие как недостаточное освещение, искажение и размывание изображений, требуют разработки новых подходов и решений.

Для улучшения качества изображений с низкой видимостью применяются фильтры и алгоритмы обработки изображений. Эти методы способны подавлять шум, повышать контрастность и восстанавливать детали на нечетких изображениях. Кроме того, используются техники компенсации атмосферных условий, таких как туман и дым.

Технологии глубокого обучения и нейронные сети демонстрируют высокую эффективность в задачах машинного зрения при плохих условиях видимости. Они обладают способностью извлекать визуальные признаки даже из искаженных или размытых изображений и выполнять их классификацию.

В последние десятилетия технологии искусственного интеллекта и робототехники, в том числе машинное зрение, остаются одними из наиболее активно развивающихся информационных систем. Статистические и экономические данные свидетельствуют о включении этой системы в пятнадцатку наиболее востребованных информационных технологий.

Российский рынок систем компьютерного зрения имеет значительный объем и оценивается более чем в 7 миллиардов рублей. Как отмечают исследователи, одним из ключевых трендов будущего станет преобразование физического мира с помощью беспилотных транспортных средств на суше, в воздухе и воде. Перемещение людей и грузов станет более эффективным и безопасным благодаря применению современных технологий слежения и распознавания с использованием машинного зрения в различных условиях видимости.

Машинное зрение представляет собой совокупность алгоритмических подходов, позволяющих решать задачи распознавания объектов. Эта технология прочно закрепилась во многих отраслях промышленности нашей страны. Распознаваемые объекты могут быть как статическими, так и динамическими. В настоящее время машинное зрение обладает достаточной мощностью для использования без участия человека в различных сферах жизни.

Целью данного исследования является изучение применения технологий машинного зрения в условиях ограниченной видимости.

Исследование применения машинного зрения

Методология: Данное исследование основано на анализе научной литературы, проведении сравнительного анализа и синтеза данных, а также графической интерпретации полученных результатов.

Результаты:

Анализ статистики, предоставленной компанией Tractica, свидетельствует о стремительном росте рынка применения машинного зрения. В розничной торговле наблюдается тенденция к увеличению производства камер видеонаблюдения, способных функционировать в различных условиях освещения и проходимости. Такие камеры позволяют собирать аналитические данные о местоположении людей в помещении, автомобильного трафика на дорогах, видимости дорожной разметки, пешеходных переходов и других объектов.

Основные компоненты современного машинного зрения:

  • Одна или несколько цифровых или аналоговых камер (черно-белых или цветных) с соответствующей оптикой для получения корректных изображений.
  • Встроенное программное обеспечение для обработки изображения. Аналоговые камеры дополнительно оснащаются оцифровщиками.
  • Передовой процессор многоядерного или встроенного типа, обладающий инструментами для разработки приложений.
  • Возможность ввода/вывода данных и передачи результатов по каналам связи.
  • Камера “умного” типа.
  • Лампы люминесцентного и галогенного типов.
  • Светодиоды.
  • Встроенные приложения для обработки изображений и выявления определенных свойств и данных.
  • Датчик обнаружения (магнитный или оптический) для захвата и обработки необходимых изображений.
  • Утилизирующие приводы для удаления дефектных деталей.

Важно отметить, что эффективное функционирование системы машинного зрения напрямую зависит от оптимизированного алгоритма управления её компонентами. Алгоритм автономного управления подразумевает самостоятельное движение беспилотных транспортных средств по предварительно определенному маршруту, согласованному с траекториями других подобных машин.

В контексте получения изображений объектов при неблагоприятных условиях освещения эффективность традиционных методов компьютерного зрения ограничена. Современные транспортные средства всё чаще рассматриваются как интегрированные системы, что повышает значимость машинного зрения. Для успешной реализации автоматизированных транспортных систем и обеспечения надёжности ряда современных систем помощи водителю требуется создать инфраструктуру, которую машинное зрение могло бы достоверно интерпретировать и использовать для безопасного управления. При этом, такая инфраструктура должна быть доступна и полезна для водителей.

Объединение машинного зрения с лидарными установками позволяет распознавать тёмные объекты даже на значительных расстояниях. Глубокое обучение, использующее нейронные сети для анализа данных, способствует эффективному распознаванию объектов в условиях недостаточной освещённости. Существующие беспилотные системы, оснащённые радарами, испытывают трудности с видимостью в тёмное время суток. Согласно мнению экспертов из разных стран, лидары могут решить эту проблему. Например, израильские учёные предложили в своём исследовании комбинировать лидары и машинное зрение, преобразуя облака точек лидара в фотореалистичные изображения с помощью генеративно-состязательной сети (GAN).

Лидары обладают оптическим диапазоном, рассчитанным на большую дальность. В составе системы машинного зрения они способны формировать двумерные и трёхмерные изображения. В отличие от радаров, лидары используют когерентное лазерное излучение, что позволяет рассеивать световые волны в любых условиях видимости, в то время как радары отражают только крупные металлические объекты. Лидары являются современным инструментом, позволяющим беспилотным системам ориентироваться в пространстве без вмешательства водителя. Они широко используются на роботизированных автомобилях Google и в гонках DARPA.

Таким образом, проблема обнаружения объектов при различных условиях видимости решается сегодня за счёт совершенствования машинного зрения, внедрения новых технологий и обучения в целом. На наш взгляд, развитие этой информационной системы сосредоточено на интересных направлениях, таких как передача нейронного стиля, сегментация, отслеживание и, безусловно, обнаружение объектов.

Работа системы машинного зрения на основе камер и лидара в мобильных роботах характеризуется динамичным сбором информации с датчиков. Это позволяет гибко изменять параметры обзора камер, обновлять трехмерную модель сцены и оптимизировать работу сканерной системы.

Планирование маршрута мобильного робота требует детального картографирования рабочей области с классификацией зон по проходимости. Зоны условной проходимости – это участки, где движение возможно с ограничениями по скорости или направлению. Для получения полной информации о координатах объектов необходимы измерения трехмерного изображения с различных точек зрения. При этом прозрачные объекты будут отображаться только с одной стороны, обращенной к наблюдателю.

Использование трехмерных оптических камер и лидаров позволяет решать задачи измерения и отображения зон с ограниченной видимостью и условной проходимостью. Обработка данных с этих датчиков осуществляется с помощью специализированного программного обеспечения, в том числе библиотек OpenCV, широко применяемых в исследованиях машинного зрения.

Лидар обладает преимуществом перед камерами в способности преодолевать проблему бликов. Светочувствительный сенсор камеры может перенасыщаться при ярком освещении, что приводит к потере четкости изображения. Датчик лидара, благодаря своей высокой емкости и чувствительности ко времени сигнала, позволяет получать более чистые данные.

Несмотря на надежность лидара в условиях яркого света, он имеет ограничения по разрешению и типу выдаваемых данных. Поэтому оптимальным решением является комбинация лидара и камеры, что позволяет использовать данные с каждого датчика для взаимной проверки и дополнения, обеспечивая более полную и точную картину окружающей среды. Такая избыточность информации минимизирует риск несчастных случаев, связанных с неправильной интерпретацией или отсутствием данных.

Выводы

Таким образом, применение лидарной технологии в условиях ограниченной видимости позволяет получать точные пространственные данные в виде облака точек. Это облако способно фиксировать необработанные изображения, сканировать объекты и элементы окружающей среды как внешние, так и внутренние. Лидар преобразует полученные необработанные изображения в формат, доступный для интерпретации.

Израильские специалисты отмечают, что созданные на основе этой технологии модели способны прогнозировать визуальные характеристики определенных объектов. Данный метод позволяет обнаруживать, например, темные автомобили, которые радары не могут идентифицировать из-за низкой отражающей способности. В будущем лидарная технология может быть использована для визуального распознавания объектов на фотореалистичных изображениях, сгенерированных из облаков точек.

Анализ современных исследований в данной области свидетельствует о значительном потенциале внедрения лидарной технологии. Для её успешного развития необходимо выявить и устранить существующие недостатки, а также продолжить совершенствование этой идеи на глобальном уровне. Разработка единых стандартов для систем машинного зрения позволит стабилизировать рынок лидарной технологии и увеличить её коммерческий успех.

Литература

  1. Захаров В. С. Технологии компьютерного зрения на российском и мировых рынках и их перспективы // Вестник Таганрогского института управления и экономики. 2022. № 1. С. 114–115.
  2. Шумский С. Машинный интеллект. Очерки по теории машинного обучения и искус- ственного интеллекта. Москва: Издательство РИОР, 2022. 340 с.
  3. Горячкин Б. С., Китов М. А. Компьютерное зрение // E-Scio. № 9(48). С. 317–345. EDN: EBYPIO.
  4. Орлов С. П., Сусарев С. В., Морев А. С. Система технического зрения автономного сельскохозяйственного автомобиля. Материалы VI Всероссийской научно-технической конференции. Челябинск,
  5. Силюнин В. А., Смыцко М. В. Использование компьютерного зрения в автоматизирован- ной робототехнике для охраны здоровья // Молодой ученый. № 22(364). С. 121–123.
  6. Крейман Г. Биологическое и компьютерное зрение / пер. с англ. И. Л. Люско; под ред. Т. Б. Киселевой, Т. И. Люско. Москва: ДМК Пресс, 2022. 314 с.
  7. Кристофер М. Бишоп. Распознавание образов и машинное обучение. Москва: Диалек- тика, 2020. 962 с.
  8. Бакшанский Р. Ю. Визуализация быстропротекающих процессов с использованием камеры машинного зрения // Избранные доклады 67-й Университетской научно- технической конференции студентов и молодых ученых. 19–23 апреля 2021 года. Томск: Томский государственный архитектурно-строительный университет, 2021. С. 327–328. EDN:
  9. Искров Н. С., Буряк Д. В., Касимов Г. Э. О Библиотеке OpenCV для реализации си- стемы машинного зрения в условиях плохой видимости под водой // Материалы XXVI Международной научно-практической конференции, посвященной памяти генерального конструктора ракетно-космических систем академика М. Ф. Решетнева. В 2-х частях. Часть 2 / под общей редакцией Ю. Ю. Логинова. Красноярск,
  10. Куутти С., Фаллах С., Катсарос K. B. и др. Обзор современных методов локализа- ции и их потенциала для применения в беспилотных транспортных средствах // Избранные доклады 4-й Азиатско-Тихоокеанской конференции по интеллектуальным роботизирован- ным системам. 2022. С. 829–846.