Программисты Habr Career 17 июн. 2026 г.
ML Platform Engineer
РОСГОССТРАХ СНГ / Россия Офис
По договоренности
Зарплата
По договоренности
Локация
СНГ / Россия
Формат
Офис
Источник
Habr Career
ML Platform Engineer
О компании
Росгосстрах развивает внутреннюю AI-платформу — экосистему сервисов для автоматизации ключевых бизнес-процессов. Мы формируем новую команду для улучшения качества ML-моделей, сокращения времени их разработки и быстрого вывода в промышленную эксплуатацию.
Задачи
- Интеграция существующих ML-моделей в бизнес-процессы, масштабирование и запуск в продакшен.
- Настройка и поддержка пайплайнов и сервисов для пакетного (batch) и потокового (online) инференса.
- Разработка и отладка DAG-ов в Airflow.
- Контейнеризация сервисов и эксплуатация моделей в Kubernetes.
- Разработка и поддержка API на FastAPI для интеграции моделей.
- Обеспечение стабильной работы ML-сервисов в продакшене.
- Версионирование моделей и управление артефактами.
- Оптимизация инференса и контроль использования ресурсов.
- Развитие инфраструктуры полного жизненного цикла ML-моделей.
Требования
Обязательные
- Опыт в MLOps / ML-engineering от 3 лет.
- Понимание ML-алгоритмов и жизненного цикла модели: от постановки задачи и экспериментов до деплоя и мониторинга в продакшене.
- Знание принципов работы бустингов, отличий трансформеров (LLM) от классических нейросетей, понимание эмбеддингов и их применения.
- Уверенное владение Python и FastAPI: асинхронное/многопоточное программирование (asyncio, threading, multiprocessing).
- Понимание ООП и принципов SOLID, опыт проектирования поддерживаемых, документированных и высоконагруженных API.
- Работа с SQLAlchemy и асинхронными драйверами баз данных.
- Опыт разработки и отладки DAG-ов в Airflow для batch-инференса моделей.
- Опыт работы с Docker и Kubernetes: эксплуатация production-кластеров, настройка ресурсных лимитов.
- Работа с реляционными (SQL) и NoSQL базами данных для хранения структурированных данных.
Будет преимуществом
- Опыт развертывания моделей на inference-платформах: KServe, Seldon, TorchServe.
- Работа с Triton Inference Server: оптимизация инференса, динамическое батчирование, использование разных бекендов (TensorRT, ONNX).
- Опыт инференса больших языковых моделей (vLLM, llama), оптимизация GPU-памяти, continuous batching.
- Проектирование агентных систем с использованием LangChain, LlamaIndex, LangGraph.
- Работа с real-time системами: Kafka, RabbitMQ, streaming-инференс, Faust.
Мы предлагаем
- Полностью официальная заработная плата и годовая премия.
- График работы 5/2, возможен удаленный формат.
- ДМС после успешного прохождения испытательного срока.
- Корпоративные скидки на страховые продукты (автострахование, ВЗР и т.д.).
- Скидки на фитнес, магазины-партнеры, книги.
- Доступ к электронной библиотеке (более 3000 книг по актуальным темам).
- Специальные мероприятия для сотрудников и их детей, подарки на Новый год.
Эта вакансия размещена на стороннем сайте. Отклик нужно сделать там.
Откликнуться на Habr CareerВы перейдёте на внешний сайт
Стек технологий
PythonFastAPIKubernetesDockerApache Airflow