Автопилот для CV как доучивать модели без ручной работы

ML и AI в производственных компаниях

Доклад принят в программу конференции

Целевая аудитория

CV-инженеры, Data-сайентисты.

Тезисы

В промышленных CV проектах часто сталкиваются с жёстким дефицитом данных — мало размеченных примеров, нет времени на сбор новых, а качество имеющихся оставляет желать лучшего. Классические подходы к обучению моделей в таких условиях оказываются неэффективными — либо требуют огромных бюджетов на разметку, либо дают низкую точность.

Мы предлагаем автоматизированный конвейер для развёртывания CV-решений в условиях дефицита данных, который сочетает три ключевых компонента: генерацию синтетических данных для реалистичного расширения обучающей выборки, автоматическую разметку с использованием предобученных моделей и методов активного обучения, и MLOps-инфраструктуру для непрерывного дообучения моделей на новых данных без необходимости полного перезапуска обучения.

Никита Каменев

СИБУР Цифровой

В МГТУ им. Н.Э. Баумана, который Никита окончил в 2020 г., принимает участие в разработке Малого спускаемого аппарата. Также занимается проведением научных исследований, в основе которых лежит применение нейронных сетей для решения задач, связанных с вихревыми методами.
Последние два года занимается разработкой детекторов в нефтехимии.

СИБУР Цифровой

СИБУР Цифровой — это IT-кластер СИБУРа, ведущей нефтехимической компании на рынке РФ. Решают креативные задачи по цифровизации нефтехимического производства и бизнеса. Это задачи, связанные с Data Science, цифровой разработкой, промышленным интернетом вещей (IIoT), дополненной и виртуальной реальностью (AR и VR), управлением данными и BI-инструментами. В Цифровом СИБУРе 200+ проектов с IТ-составляющей, более 200 IТ-систем и 100+ IТ-компетенций! А главное — с ними работает более 2000 сотрудников, благодаря которым они строят цифровые заводы будущего уже сегодня.

Видео

Другие доклады секции

ML и AI в производственных компаниях