Программисты Habr Career 29 мая 2026 г.
MLOps
Лаборатория Касперского СНГ / Россия Офис
По договоренности
Зарплата
По договоренности
Локация
СНГ / Россия
Формат
Офис
Источник
Habr Career
О нас
Команда SS-infra (Security Services Infrastructure) занимается развитием и автоматизацией инфраструктуры для пентестеров, Red Teaming, Incident Response, Threat Hunting и смежных направлений. Мы закрываем полный цикл DevOps, SecOps и DevSecOps. Сейчас мы ищем MLOps-инженера с ML- или DevOps-бэкграундом, который готов пилотировать и внедрять новые решения. Помимо ML-инфраструктуры, предстоит подключаться к классическим DevOps-задачам команды.
Задачи
- Проектирование архитектуры AI-систем от прототипа до production
- Внедрение и настройка GPU-планировщика (Kueue, Volcano или аналог) для эффективного разделения ресурсов на одном оборудовании
- Проектирование и сопровождение ML-пайплайнов: обучение, валидация, деплой моделей
- Организация CI/CD для моделей: версионирование данных, моделей, экспериментов
- Мониторинг production-моделей (drift detection, performance tracking)
- Деплой и оптимизация LLM и inference-серверов (vLLM, TGI, Triton)
- Контейнеризация и оркестрация сервисов (Docker, Kubernetes)
- Настройка CI/CD (GitLab CI, Jenkins, практики GitOps)
- Управление инфраструктурой как кодом (Terraform, Ansible)
- Мониторинг и observability (Prometheus, Grafana, Loki)
- Автоматизация рутинных операций и обеспечение требований ИБ
- Ведение технической документации по вверенным ресурсам
Требования
- Бэкграунд в ML/DS: понимание процессов обучения, инференса, работы с данными
- Опыт от 2 лет в MLOps или DevOps с ML-спецификой
- Production-опыт работы с Docker, Kubernetes (Helm, управление кластерами)
- Уверенное владение Python
- Опыт с CI/CD (GitLab CI, Jenkins, методология GitOps)
- Глубокие знания Linux
- Навыки работы с Terraform и Ansible для IaC
- Опыт построения или управления GPU-кластерами (NVIDIA, CUDA, nvidia-container-toolkit)
- Опыт с GPU-планировщиками (Kueue, Volcano, Run:ai или аналоги)
- Практика использования MLflow, Kubeflow, Airflow или аналогичных инструментов
- Высшее техническое образование
Будет плюсом:
- Опыт работы с LLM и inference-серверами (vLLM, TGI, Triton)
- Знакомство со стеком команды: Gitlab, Nginx, Kafka, RabbitMQ, Elasticsearch, Loki, Grafana, Vault, Keycloak
- Понимание специфики multi-tenant GPU-шаринга (MIG, MPS, time-slicing)
- Опыт работы с Talos OS или Flatcar
- Опыт построения гетерогенной инфраструктуры (on-premise + облака)
Эта вакансия размещена на стороннем сайте. Отклик нужно сделать там.
Откликнуться на Habr CareerВы перейдёте на внешний сайт
Стек технологий
Информационная безопасность