LLMOps / ML Platform Engineer

Юкитех Лаб

от 200 000 руб.
до 260 000 руб.

Санкт-Петербург Опыт работы от 3 лет Постоянная занятость Полный день

Поделиться Сохранить

Описание

LLMOps / ML Platform Engineer (Self-Hosted LLM)

О компании

Мы продуктовая IT-команда, разрабатывающая собственные информационные системы. Работаем с современным технологическим стеком и микросервисной архитектурой. В связи с развитием продукта ищем LLMOps / ML Platform Engineer, который разработает нам сервисы для LLM и оптимизирует их работу на железе .

Задачи

Разработка и поддержка продакшен-сервисов под собственную LLM (backend / API / internal services), системы синтеза и распознавания речи, оптимизация инференса отдельных компонентов и системы в целом для NRT эксплуатации
Построение и развитие DevOps-pipeline для ML-сервисов : сборка, деплой, обновления, мониторинг; внедрение и развитие практик MLOps :
- CI/CD для ML-сервисов
- наблюдаемость (логи, метрики, трассировка)
- управление версиями и релизами моделей
Контейнеризация решений и эксплуатация в Kubernetes (AWS + on-prem).
Совместная работа с backend-командой.

Требования обязательные:

Опыт коммерческой разработки от 3 лет .
Уверенное владение Python , SOLID, многопоточная и асинхронная разработка, оптимизация сервисов на Python под быстродействие.
Опыт разработки серверных сервисов (REST/gRPC).
Понимание жизненного цикла ML/LLM решений в продакшене; понимание подходов оптимизации ML-пайплайнов для инференса
Понимание особенностей основных архитектур и пайплайнов NN/ML решений, прежде всего в области ASR, TTS, LLM; понимание разницы между real-time и batch инференсом;
Практический опыт Docker и контейнеризации
Опыт работы с GPU (деплой, конфигурация, эксплуатация); наличие решений в продакшен

Требования желательные:

Опыт эксплуатации ML-сервисов в AWS и/или on-prem .
Работа с monitoring/observability (Prometheus, Grafana, OpenTelemetry и аналоги).
Опыт оптимизации inference-нагрузок (batching, caching, resource tuning).
Опыт реализации CI/CD для ML-проектов.
Знакомство с vLLM / llama.cpp/TGI, Triton/TorchServe, Onnx

Условия

Удалённая работа , полная занятость.
Продакшен-задачи, влияние на архитектуру и инфраструктурные решения.
Конкурентная зарплата (готовы обсуждать по опыту).

Откликнуться

3 дня назад Источник: hh.ru

Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.

Рекомендуемые вакансии

Middle+/Senior Kubernetes Platform Engineer

2ГИС
Санкт-Петербург

Описание Привет! Мы команда Infrastructure & Operations. Создаем PaaS платформу для работы с "Data services" (DS): PostgreSQL, Redis, Kafka, ClickHouse и другими хранилищами. Наша миссия сделать ...

05.02.2026; Источник: hh.ru

Подробнее

ML / Data engineer практикант / стажер (практикант)

Газпром ЦПС
Санкт-Петербург

Описание

Газпром ЦПС аккредитованная ИТ-компания, реализующая цифровую и организационно-функциональную трансформацию компаний группы Газпром .

Приглашаем ...

18.02.2026; Источник: hh.ru

Подробнее

Senior Go Platform Engineer

VK
Санкт-Петербург

Описание

DevPlatform это внутренняя платформа, которая помогает десяткам команд разрабатывать, тестировать, деплоить и сопровождать сервисы быстрее, надёжнее и безопаснее.

Мы ищем ...

09.02.2026; Источник: hh.ru

Подробнее

Посмотреть все похожие вакансии