Fullstack / LLM Engineer

Агентство судебного взыскания
  • от 250 000 руб.
Санкт-Петербург Опыт работы от 3 лет Постоянная занятость Полный день
Поделиться

Описание

Мы - Агентство судебного взыскания (АСВ, LCA) - международная юридическая компания, объединившая в себе современные IT-технологии и юридический опыт.

На данный момент развиваем edtech платформу, которая подключается к внешним LLM моделям и даёт пользователям умные инструменты для обучения. Ищем инженера , который возьмёт на себя развитие и доработку backend/frontend части сайта и API интеграций с LLM .

Мы предлагаем:

  • 100% БЕЛУЮ заработную плату: оклад 250 000 руб. + ежемесячные премии + полугодовые премии (в среднем 300 000 руб.);
  • регулярные выплаты 2 раза в месяц;
  • график работы 5/2 с 9:00 до 18:00, гибрид ;
  • официальное трудоустройство по ТК РФ , отпуска и больничные оплачиваются;
  • ДМС после первого года работы;
  • современная система материальной мотивации : полугодовые премии, предоставление материальной помощи, корпоративные подарки;
  • развитая корпоративная культура : участие в тим-билдингах и флэшмобах, champion challenge, регулярное предоставление обратной связи от руководителя, предоставление компенсаций за медицинские услуги, меню льгот (компенсация затрат на фитнес, обучение, санатории, косметология);
  • команда руководителей , которые умеют слушать и мотивировать.

Ключевые задачи:

  • Разработка и поддержка продакшен сервисов на Python (FastAPI) для работы с внешними LLM API и другими AI сервисами.

  • Проектирование, разработка и оптимизация API эндпоинтов (REST/gRPC) для LLM функциональности: генерация контента, чат интерфейсы, обработка запросов пользователей.

  • Интеграция этих API во frontend на Vue.js: формы запросов, чат интерфейсы, отображение прогресса, стриминг ответов.

  • Развитие и поддержка SPA/SSR приложения на Vue.js: компоненты, роутинг, стейт менеджмент, взаимодействие с backend API.

  • Оптимизация UX/перформанса фронтенда: работа с асинхронными запросами, debounce, отображение прогресса и ошибок, оптимизация рендеринга.

  • Оптимизация инференса: снижение latency, рост throughput и контроль стоимости запросов к LLM (батчинг, кеширование, стриминг ответов и т.п.).

  • Развитие DevOps pipeline для ML/LLM сервисов: CI/CD, управление версиями моделей и конфигураций, безопасные релизы, A/B тесты и быстрый rollback.

  • Настройка наблюдаемости: метрики, логи, трассировка для API и LLM интеграций.

  • Тесная работа с продуктовой и ML командой над интеграцией новых LLM фич в ядро платформы.

Мы ожидаем:

  • Опыт коммерческой разработки на Python от 3 лет.

  • Уверенное владение FastAPI: async/await, Pydantic, middleware, OpenAPI.

  • Понимание архитектуры REST/gRPC, опыт разработки и сопровождения API сервисов.

  • Опыт оптимизации Python сервисов под производительность: профилирование, снижение latency, работа с нагрузкой.

  • Понимание жизненного цикла ML/LLM решений в продакшене и принципов инференса.

  • Практический опыт работы с Docker: контейнеризация сервисов, настройка образов, health checks.

  • Коммерческий опыт разработки frontend приложений на Vue.js (Vue 2 или 3) от 1 2 лет.

    Уверенное владение :

  • JavaScript/TypeScript, Vue CLI / Vite, Vue Router, стейт менеджментом (Vuex / Pinia), Axios/fetch и работой с REST API.

  • Понимание основ верстки (HTML5, CSS3, адаптивный дизайн), базовый опыт работы с UI библиотеками (Element, Vuetify, Naive UI и др.).

3 дня назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

LLM Engineer (Python, RAG)

от 200 000 Р
  • CRT
  • Санкт-Петербург
Описание О компании: Мы представляем компанию, занимающуюся разработкой сервиса по быстрому и качественному созданию презентационных материалов. Система работает с высокими нагрузками, ежедневно обс...
26.02.2026; Источник: hh.ru
от 200 000 Р
Подробнее

Senior LLM Engineer / AI Agent Optimization Lead (Conversational AI, Sales Automation)

  • СДЕЛКА
  • Санкт-Петербург

Описание

Мы развиваем AI-агента для автоматизации коммуникации в продажах (сфера недвижимости).

Агент уже работает в продакшене, общается с реальными пользователями и генерирует ...

27.02.2026; Источник: hh.ru

Fullstack QA engineer Инженер по тестированию (Release Engineering)

  • YADRO
  • Санкт-Петербург

Описание

В группу тестирования облачных решений требуется опытный и заинтересованный QА-инженер.

Чем предстоит заниматься:

  • совместное с ...
26.02.2026; Источник: hh.ru