Лаборатория Касперского
Программисты Habr Career 29 мая 2026 г.

MLOps

Лаборатория Касперского СНГ / Россия Офис
По договоренности
Зарплата
По договоренности
Локация
СНГ / Россия
Формат
Офис
Источник
Habr Career

О нас

Команда SS-infra (Security Services Infrastructure) занимается развитием и автоматизацией инфраструктуры для пентестеров, Red Teaming, Incident Response, Threat Hunting и смежных направлений. Мы закрываем полный цикл DevOps, SecOps и DevSecOps. Сейчас мы ищем MLOps-инженера с ML- или DevOps-бэкграундом, который готов пилотировать и внедрять новые решения. Помимо ML-инфраструктуры, предстоит подключаться к классическим DevOps-задачам команды.

Задачи

  • Проектирование архитектуры AI-систем от прототипа до production
  • Внедрение и настройка GPU-планировщика (Kueue, Volcano или аналог) для эффективного разделения ресурсов на одном оборудовании
  • Проектирование и сопровождение ML-пайплайнов: обучение, валидация, деплой моделей
  • Организация CI/CD для моделей: версионирование данных, моделей, экспериментов
  • Мониторинг production-моделей (drift detection, performance tracking)
  • Деплой и оптимизация LLM и inference-серверов (vLLM, TGI, Triton)
  • Контейнеризация и оркестрация сервисов (Docker, Kubernetes)
  • Настройка CI/CD (GitLab CI, Jenkins, практики GitOps)
  • Управление инфраструктурой как кодом (Terraform, Ansible)
  • Мониторинг и observability (Prometheus, Grafana, Loki)
  • Автоматизация рутинных операций и обеспечение требований ИБ
  • Ведение технической документации по вверенным ресурсам

Требования

  • Бэкграунд в ML/DS: понимание процессов обучения, инференса, работы с данными
  • Опыт от 2 лет в MLOps или DevOps с ML-спецификой
  • Production-опыт работы с Docker, Kubernetes (Helm, управление кластерами)
  • Уверенное владение Python
  • Опыт с CI/CD (GitLab CI, Jenkins, методология GitOps)
  • Глубокие знания Linux
  • Навыки работы с Terraform и Ansible для IaC
  • Опыт построения или управления GPU-кластерами (NVIDIA, CUDA, nvidia-container-toolkit)
  • Опыт с GPU-планировщиками (Kueue, Volcano, Run:ai или аналоги)
  • Практика использования MLflow, Kubeflow, Airflow или аналогичных инструментов
  • Высшее техническое образование

Будет плюсом:

  • Опыт работы с LLM и inference-серверами (vLLM, TGI, Triton)
  • Знакомство со стеком команды: Gitlab, Nginx, Kafka, RabbitMQ, Elasticsearch, Loki, Grafana, Vault, Keycloak
  • Понимание специфики multi-tenant GPU-шаринга (MIG, MPS, time-slicing)
  • Опыт работы с Talos OS или Flatcar
  • Опыт построения гетерогенной инфраструктуры (on-premise + облака)

Эта вакансия размещена на стороннем сайте. Отклик нужно сделать там.

Откликнуться на Habr Career

Вы перейдёте на внешний сайт

Стек технологий

Информационная безопасность