В связи с развитием индустрии 4.0 предприятие Tetra Pak решило создать систему технического зрения для распознания кода клише, изображенного на нем.
Нанесение неверных клише (гибкие резиновые формы для высокой печати) – критически важная потеря для предприятия, так как данный дефект трудно обнаружить на производстве и бывают случаи отправления этого дефекта заказчику, что сильно бьет по репутации компании.


Пример клише


Задача

Разработать систему компьютерного зрения для визуальной идентификации клише и исключить ошибки оператора при монтаже на печатный вал.

Каждое клише имеет индивидуальный номер. Данный номер или его часть наносятся на клише двумя способами: 

  • маркером с помощью робота для оператора;
  • с помощью лазерной гравировки в район микроточек, используемых для позиционирования.


Решение

Проект выполнялся в два этапа:

  1. Создание системы, которая распознавала надписи, написанные роботом. В данном случае был использован стандартный алгоритм, изложенный в справке MATLAB Automatically Detect and Recognize Text in Natural Images. Видеосигнал с веб-камеры поступал в алгоритм уменьшения засветки, задача которого была отсечь блики от освещения, солнца и т. д. Решение хорошо показало себя, имело удовлетворительную скорость и качество распознания. Но в то же время невозможно распознать клише, которые используются повторно. Также оно добавляет действий операторам, но при этом не снижает риск перепутать клише после проверки. В итоге данное решение было отклонено.
  2. Второй этап был нацелен на распознание символов возле микроточки непосредственно в момент монтажа клише на печатный вал, т. е. оператор дает команду на монтаж, система сравнивает номер на клише с базой данных и дает разрешение на монтаж.


Для распознания было решено использовать технологию глубокого обучения, так как алгоритм OCR показал слабые результаты.
Итого, на первом этапе был создан аналогово-цифровой конвертер изображений с камеры машины монтажа.

На втором этапе – система видеозахвата микроточек. За несколько месяцев была сформирована база данных из 4000 изображений, которой оказалось достаточно для обучения нейронной сети. Разметка изображений выполнялась с помощью инструмента Image Labeler.

Применив Parallel Computing Toolbox на производительном ПК с GPU, удалось сократить время распознания клише с 10 секунд до 0,8 секунды.
Благодаря применению автоматизированных инструментов MATLAB удалось проверить эффективность различных архитектур нейронных сетей. Наилучшее соотношение скорость/качество распознания показали сети семейства VGG.


Результат

Все данные успехи были достигнуты для одной из трех машин на производстве. Разработанный алгоритм был развернут на 3-х машинах монтажа с помощью MATLAB Compiler. В настоящий момент работа по увеличению базы данных изображений и выбору архитектуры нейронной сети продолжается.

На текущий момент собрано 20 000 изображений, используется архитектура YOLO2, а время распознания сокращено до 0,05 секунд с качеством распознания 97%.

С подробным отчетом можно ознакомиться по ссылке.

Используемые технологии

 Цитата

«Работа с инженерами ЦИТМ Экспонента велась в рамках пилотного проекта. Благодаря большому опыту специалисты помогли опробовать различные варианты решения задачи и выбрать наиболее подходящий» – Степан Воронин, инженер по статистическому контролю производства.


О компании

Tetra Pak – транснациональная компания по производству упаковки, упаковочных автоматов и оборудования для переработки жидких пищевых продуктов, а также оборудования для групповой упаковки.