Аналитик-разработчик (GigaChat)

СБЕР
Санкт-Петербург Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (Text, Vision, Audio, Embeddings и др.).

Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии.

Сейчас мы ищем продуктового аналитика, который будет помогать нам с околорелизными процессами: системно оценивать модели, собирать тестовые наборы данных и отслеживать качество ответов на ключевых сценариях использования.

Обязанности

  • Анализировать требования к качеству моделей и формализовывать их в тестовые сценарии и чек-листы
  • собирать и поддерживать тестовые сеты
  • участвовать в релизном процессе: проводить приёмку модели, оценивать качество ответов, считать автоматические метрики, организовывать и анализировать ручную разметку
  • использовать современные подходы к оценке качества LLM:
  • SBS (side-by-side evaluation) - сравнение моделей между собой
  • LLM-as-a-judge - автоматическая оценка ответа с помощью другой модели
  • специализированные сайты, бенчмарки (ChatBot Arena, MT-Bench и др.)
  • взаимодействовать с командой разработчиков: выявлять потенциальные проблемы, предлагать улучшения
  • отслеживать баг-репорты, классифицировать их и формировать задачи
  • проводить анализ пользовательских логов, выявлять системные ошибки и регистрировать инциденты
  • развивать автоматизацию проверки качества и интегрировать её в пайплайн релизов

Требования

  • уверенное владение Python и опыт работы с библиотеками для анализа данных (pandas, NumPy и др.)
  • знание и практическое применение публичных бенчмарков (MMLU, GSM8K, MATH, HumanEval и тд)
  • практический опыт работы с современными LLM: Llama, Mistral, Qwen, GPT (OpenAI), Gemini (Google), Claude (Anthropic) или аналогичными
  • навыки работы с данными: очистка, нормализация, подготовка датасетов
  • внимательность к деталям, умение находить нестандартные ошибки в сложных сценариях
  • способность документировать процессы в понятной форме

Условия

  • удаленный/гибридный/офисный формат в Москве, Санкт-Петербурге и Нижнем Новгороде
  • ежегодный пересмотр зарплаты и годовая премия
  • расширенный ДМС и льготное страхование для семьи
  • уникальная система обучения Сбера для профессионального и карьерного развития
  • выгодная ипотека для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компании-партнёров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа.
9 дней назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Аналитик-разработчик

  • СБЕР
  • Санкт-Петербург
Описание Наша команда занимается интеграцией LLM GigaChat в продукты SberDevices с многомиллионной аудиторией. Мы делаем доступным для всех опыт взаимодействия с передовыми большими языковыми ...
13.11.2025; Источник: hh.ru

Маркетинговый аналитик-разработчик в Авто.ру

  • Яндекс
  • Санкт-Петербург
Описание Команда Яндекс Вертикалей ищет аналитика-разработчика. Мы помогаем растить бизнес Авто.ру во всех регионах России . Если вам интересно пер естр аивать и улучшать маркетинговую аналитику, ...
07.11.2025; Источник: hh.ru

Аналитик-разработчик / Data analyst (Python + SQL)

  • Адверт Лайн
  • Санкт-Петербург
Описание Привет! Мы технологическая компания с сильной экспертизой в трафике, монетизации и digital-маркетинге. Мы развиваем экосистему продуктов: от CPA и RTB до собственных рекламных платформ и ...
11.11.2025; Источник: hh.ru