LLM Engineer (Python, RAG)

CRT
  • от 200 000 руб.
Санкт-Петербург Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

О компании:
Мы представляем компанию, занимающуюся разработкой сервиса по быстрому и качественному созданию презентационных материалов. Система работает с высокими нагрузками, ежедневно обслуживая около 20 000 пользователей.

Компания внесена в реестр аккредитованных IT-компаний

Будет плюсом, если в сопроводительном письме укажете свой Telegram .

Чем предстоит заниматься:
Разворачивать и поддерживать LLM-модели в корпоративном контуре на базе Qwen, Llama, Mistral и аналогов
Проектировать и реализовывать RAG-системы
Интегрировать LLM в основной продукт компании редактор презентаций
Выполнять дообучение LLM-моделей (LoRA или QLoRA)
Оптимизировать запросы к модели для снижения количества используемых токенов
Писать и поддерживать техническую документацию

Что мы ждём от кандидата:
Коммерческий опыт разработки на Python на уровне middle или выше
Опыт развёртывания LLM-моделей в локальном или корпоративном контуре
Опыт дообучения LLM-моделей (методами LoRA или QLoRA)
Практический опыт проектирования и внедрения RAG-систем
Уверенная работа с Git в командной разработке

Будет преимуществом:
Опыт работы с vLLM, TGI, Ollama, HuggingFace Inference
Работа с векторными базами Qdrant, Milvus, Weaviate
Опыт оптимизации производительности LLM-сервисов
Базовое понимание Docker, Linux и GPU-окружения
Опыт работы с высоконагруженными сервисами

От компании:
Официальное трудоустройство в аккредитованную IT-компанию.
График работы 5/2 с возможностью гибкого начала и окончания рабочего дня.
Полностью официальная заработная плата без задержек, с плановым увеличением в течение 2-х лет.
Удаленный формат работы.

день назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Automation QA Engineer (Python)

  • Леста Игры
  • Санкт-Петербург
Описание Сейчас мы ищем Automation QA Engineer для работы в команде Foundation в офисе в Санкт-Петербурге . Подразделение Foundation занимается разработкой и оперированием общих сервисов для игр ...
30.01.2026; Источник: hh.ru

QA Engineer (Python) / Инженер по автоматизированному тестированию (TATLIN.UNIFIED)

  • YADRO
  • Санкт-Петербург
Описание Наш отдел тестирования унифицированной СХД часть большой команды разработки флагманского продукта компании TATLIN.UNIFIED . Продукт представляет собой современное хранилище, созданное для ...
28.01.2026; Источник: hh.ru

Senior SDET engineer (Python) / Старший инженер-программист

  • YADRO
  • Санкт-Петербург
Описание В Департаменте контроля качества мы ориентированы на автоматизацию тестирования и активно ищем инженеров, которые не только умеют писать стабильные и качественные автотесты, но и обладают ...
28.01.2026; Источник: hh.ru