ML Engineer (GigaChat Data)
СБЕРОписание
Мы команда ML-инженеров, специализирующаяся на инфраструктуре данных и валидации моделей. Наша команда создает критически важные инструменты для оценки качества моделей, разрабатывает пайплайны обработки данных и фокусируется на генерации высококачественных технических и кодовых данных для обучения моделей.
Наши основные направления:
Validation & Metrics инструменты валидации и замера моделей
Data Engineering пайплайны чистки и синтеза данных
Code & Technical Data генерация кодовых/технических данных
MLOps хостинг и использование open source моделей
Model Training эксперименты с LoRA и SFT.
Если тебе интересно создавать инфраструктуру для развития LLM и работать с передовыми технологиями в области данных приходи к нам.
Обязанности
- разработка инструментов для валидации и замера качества моделей и систем контроля качества данных
- создание метрик оценки производительности и точности LLM
- автоматизация процессов тестирования и бенчмаркинга, фильтрации и предобработки
- построение и оптимизация пайплайнов чистки и синтеза данных
- генерация высококачественных кодовых и технических датасетов
- создание синтетических данных для обучения моделей на технических задачах
- поддержка инфраструктуры для хостинга open source моделей
- интеграция и использование open source модели в продуктовых решениях
- обучение LoRA адаптеров для экспериментальных задач
- проведение SFT обучения в рамках исследований данных
- анализ результатов экспериментов и интерпретация подходов.
Требования
- отличное знание Python и опыт работы с ML-библиотеками (LangChain/LangGraph, PyTorch, llm-foundry, verl)
- опыт работы с LLM (как open source: Llama, Mistral, Qwen, так и проприетарными: GPT, Claude)
- понимание принципов работы с данными для обучения моделей: сбор, очистка, валидация
- навыки построения ML пайплайнов и автоматизации процессов
- понимание процессов, знание подходов к валидации и тестированию моделей машинного обучения
- понимание основ MLOps и работы с контейнеризацией (Docker).
Будет плюсом:
- опыт с фреймворками для работы с агентами и RAG
- знание подходов к fine-tuning (LoRA, QLoRA, SFT)
- опыт работы с системами версионирования данных и экспериментов (DVC, MLflow, W&B)
- понимание принципов работы с кодовыми данными и техническими текстами
- опыт развертывания и мониторинга ML-моделей в production.
Условия
- крупнейшее DS&AI community более 600 DS-специалистов банка
- дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
- возможность выбрать удобный формат работы: гибрид или офис
- комфортный современный офис: ст. м. Кутузовская, пр. Кутузовский, 32
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека выгоднее до 7% для каждого сотрудника
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
10 часов назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
Senior ML Engineer (CV / Video Analytics)
Описание Мы строим платформу для интеллектуального анализа видео-контента и извлечения признаков (CV + NLP), которая превращает библиотеку из 100 000+ видеороликов в структурированные, индексируемые ...
14.01.2026; Источник: hh.ru
Senior ML Engineer / Research Engineer (NLP)
Описание Just AI лидер в области генеративного искусственного интеллекта и AI-решений для бизнеса. С 2016 года мы создаём передовые технологии на базе больших языковых моделей (LLM) и генеративного ...
15.01.2026; Источник: hh.ru
ML Engineer RecSys в Маркет
Описание Команда рекомендаций Яндекс Маркета делает персональные рекомендации товаров на главной странице, подбирает похожие и сопутствующие товары в карточке товара, а также персонализирует поиск. ...
14.01.2026; Источник: hh.ru