Предиктивный мониторинг промышленных сервисов

ML и AI в производственных компаниях

Python
Отказоустойчивость
Алгоритмы и их сравнение
Синхронизация данных, параллельная обработка, CDN
Логирование и мониторинг
Enterprise-системы
Логи, метрики, ошибки
Рекомендации / ML
ML

Доклад отклонён

Целевая аудитория

- DevOps, внедряющие AIOps платформы - ML-инженеры, аналитики данных, разрабатывающие решения IT4IT - Владельцы сервисов, интересующихся применением автоматизированных методов анализа временных рядов в контексте предиктивного мониторинга и раннего выявления отклонений

Тезисы

В крупных с увеличением количества сервисов и роста нагрузки становится актуальным ранее автоматическое предупреждение о возможных сбоях. В идеале требуется на основе анализа исторических данных по эксплуатации сервисов прогнозировать наступление инцидентов и аварий с учетом трендов, сезонности, производственных календарей.
Для решения такой задачи от нашего заказчика №1 - Банка ВТБ были рассмотрены open-source решения, такие как Prophet, Merlion, Kats. Перечисленные решения были адаптированы для анализа более 150 тысяч метрик из 200 бизнес-сервисов в инструменте "Сфера.Анализ событий". С использованием адаптивных алгоритмов выявления аномалий, не требующих экспертной настройки, инструмент предупредит о возможных сбоях и предоставит важную диагностическую информацию. Гибкие правила алертинга позволяют снизить шум за счет выбора зоны и длительности аномалий.
Использование таких инструментов в крупных компаниях в условиях роста производственного ландшафта требует значительных трудозатрат на настройку. Благодаря встроенному AutoML на основе генетических алгоритмов подбора гиперпараметров получилось увеличить количество автоматически настраиваемых метрик до 95% и сократить трудоемкость настройки модели с нескольких часов — до минут, нескольких кликов мышью.

Координирует развитие ИИ-продуктов Сферы с учетом требований и трендов рынка, отвечает за эффективное выполнение проектов по совершенствованию процессов производства с применением ИИ и взаимодействие с профильными департаментами группы Т1

Видео

Другие доклады секции

ML и AI в производственных компаниях