Программисты Habr Career 2 июн. 2026 г.
ML-инженер
ГНИВЦ СНГ / Россия Офис
По договоренности
Зарплата
По договоренности
Локация
СНГ / Россия
Формат
Офис
Источник
Habr Career
ML-инженер (ГНИВЦ)
О нас
ГНИВЦ — IT-компания и партнёр государственных структур и крупного российского бизнеса. Мы создаём и сопровождаем ключевые государственные информационные системы, а также разрабатываем коммерческие решения для налогового мониторинга.
Несколько фактов о нас:
- Входим в ТОП-100 лучших работодателей России и занимаем 9-е место среди IT-компаний в рейтинге крупных работодателей (2025 год).
- Находимся среди 25% лучших компаний по уровню счастья сотрудников в IT-сфере и по России в целом (Happy Job, 2025).
- Работает собственная ИИ-песочница — среда для экспериментов и реальных проектов на открытых языковых моделях. Можно автоматизировать работу, тестировать гипотезы и доводить идеи до результата.
- Компания аккредитована как IT-организация.
Задачи
- Разработка и дообучение классификатора названий товарных позиций на базе BERT-архитектур (предобучение, файнтюнинг, оптимизация).
- Организация и контроль разметки данных: постановка задач разметчикам, проверка качества, автоматизация пайплайнов.
- Подготовка датасетов: очистка, нормализация с использованием pandas, библиотеки datasets (Hugging Face) и регулярных выражений.
- Проектирование и реализация архитектуры моделей: эксперименты с BERT, DistilBERT, кастомными головами, ансамблевыми методами.
- Мониторинг работы моделей в production: метрики качества, обнаружение drift’а, A/B-тестирование, автоматизированное дообучение.
- Работа с PostgreSQL: создание таблиц, разработка хранимых процедур и функций, оптимизация запросов (индексы, материализованные представления, EXPLAIN ANALYZE), ETL-пайплайны для данных моделей.
- Интеграция моделей в production: контейнеризация с помощью Docker, мониторинг потребления GPU/CPU.
Требования
- Высшее образование (желательно компьютерные науки, математика или смежные специальности).
- Опыт от двух лет в NLP/ML, включая файнтюнинг моделей-трансформеров (BERT, RoBERTa, DistilBERT).
- Глубокие знания PyTorch, Hugging Face Transformers, pandas, datasets.
- Опыт работы с PostgreSQL: SQL, создание и оптимизация схем данных, хранимые функции, обеспечение производительности запросов.
- Владение техниками оптимизации моделей: квантизация, послойное планирование learning rate, создание собственных функций потерь.
- Опыт production-развёртывания ML: мониторинг, обнаружение аномалий, model serving.
- Уверенное использование Python, Git, Linux и shell-скриптов.
Будет плюсом
- Опыт классификации текстов (товарные каталоги, задачи поиска или рекомендаций).
- Навыки организации разметки данных и построения data-пайплайнов (ETL, препроцессинг).
- Работа с ONNX для инференса, multi-GPU обучение (Distributed Data Parallel).
Мы предлагаем
- Гибкие форматы работы: офис, гибридный график или полная удалённая занятость на территории РФ.
- Комфортный график: пятидневная рабочая неделя (пн–чт с 9:00 до 18:00, пт с 9:00 до 16:45).
- Конкурентная заработная плата (обсуждается на собеседовании) и премии за эффективность и достигнутые результаты.
- Официальное трудоустройство с соблюдением ТК РФ: оплачиваемый отпуск (дополнительная выплата 50% оклада после 11 месяцев работы), выплата зарплаты дважды в месяц.
- Забота о здоровье:
- компенсация больничного листа до 7 дней с сохранением полной оплаты рабочего дня;
- ДМС с качественной стоматологией после испытательного срока;
- возмещение до 50% затрат на занятия спортом.
- Развитие и обучение:
- профессиональное обучение и сертификация за счёт компании;
- внутренние и внешние митапы, хакатоны, конференции, семинары;
- партнёрские программы Skyeng и Skillbox для изучения иностранных языков и развития профессиональных навыков;
- доступ к корпоративной библиотеке на платформе Alpina Digital.
- Дополнительные выходные: 5 оплачиваемых ресурсных дней в течение календарного года для сотрудников, проработавших в компании более 11 месяцев.
Эта вакансия размещена на стороннем сайте. Отклик нужно сделать там.
Откликнуться на Habr CareerВы перейдёте на внешний сайт
Стек технологий
GitPostgreSQLPython