РОСГОССТРАХ
Программисты Habr Career 17 июн. 2026 г.

ML Platform Engineer

РОСГОССТРАХ СНГ / Россия Офис
По договоренности
Зарплата
По договоренности
Локация
СНГ / Россия
Формат
Офис
Источник
Habr Career

ML Platform Engineer

О компании

Росгосстрах развивает внутреннюю AI-платформу — экосистему сервисов для автоматизации ключевых бизнес-процессов. Мы формируем новую команду для улучшения качества ML-моделей, сокращения времени их разработки и быстрого вывода в промышленную эксплуатацию.

Задачи

  • Интеграция существующих ML-моделей в бизнес-процессы, масштабирование и запуск в продакшен.
  • Настройка и поддержка пайплайнов и сервисов для пакетного (batch) и потокового (online) инференса.
  • Разработка и отладка DAG-ов в Airflow.
  • Контейнеризация сервисов и эксплуатация моделей в Kubernetes.
  • Разработка и поддержка API на FastAPI для интеграции моделей.
  • Обеспечение стабильной работы ML-сервисов в продакшене.
  • Версионирование моделей и управление артефактами.
  • Оптимизация инференса и контроль использования ресурсов.
  • Развитие инфраструктуры полного жизненного цикла ML-моделей.

Требования

Обязательные

  • Опыт в MLOps / ML-engineering от 3 лет.
  • Понимание ML-алгоритмов и жизненного цикла модели: от постановки задачи и экспериментов до деплоя и мониторинга в продакшене.
  • Знание принципов работы бустингов, отличий трансформеров (LLM) от классических нейросетей, понимание эмбеддингов и их применения.
  • Уверенное владение Python и FastAPI: асинхронное/многопоточное программирование (asyncio, threading, multiprocessing).
  • Понимание ООП и принципов SOLID, опыт проектирования поддерживаемых, документированных и высоконагруженных API.
  • Работа с SQLAlchemy и асинхронными драйверами баз данных.
  • Опыт разработки и отладки DAG-ов в Airflow для batch-инференса моделей.
  • Опыт работы с Docker и Kubernetes: эксплуатация production-кластеров, настройка ресурсных лимитов.
  • Работа с реляционными (SQL) и NoSQL базами данных для хранения структурированных данных.

Будет преимуществом

  • Опыт развертывания моделей на inference-платформах: KServe, Seldon, TorchServe.
  • Работа с Triton Inference Server: оптимизация инференса, динамическое батчирование, использование разных бекендов (TensorRT, ONNX).
  • Опыт инференса больших языковых моделей (vLLM, llama), оптимизация GPU-памяти, continuous batching.
  • Проектирование агентных систем с использованием LangChain, LlamaIndex, LangGraph.
  • Работа с real-time системами: Kafka, RabbitMQ, streaming-инференс, Faust.

Мы предлагаем

  • Полностью официальная заработная плата и годовая премия.
  • График работы 5/2, возможен удаленный формат.
  • ДМС после успешного прохождения испытательного срока.
  • Корпоративные скидки на страховые продукты (автострахование, ВЗР и т.д.).
  • Скидки на фитнес, магазины-партнеры, книги.
  • Доступ к электронной библиотеке (более 3000 книг по актуальным темам).
  • Специальные мероприятия для сотрудников и их детей, подарки на Новый год.

Эта вакансия размещена на стороннем сайте. Отклик нужно сделать там.

Откликнуться на Habr Career

Вы перейдёте на внешний сайт

Стек технологий

PythonFastAPIKubernetesDockerApache Airflow