ML Engineer (Multi-modal)
Интеллектуальные Системы УправленияОписание
О проекте
Мы разрабатываем конфиденциальную AI-платформу , работающую с разнородными данными и моделями
Система включает:
- backend + frontend
- пайплайны обработки данных
- self-hosted AI-модели
- файловое хранилище
- SQL / NoSQL / time-series БД
- K8s инфраструктуру
В настоящий момент мы меняем архитектурный подход:
- уходим от классического RAG
- переходим к алгоритмическому поиску и гибридным подходам
- активно экспериментируем с новыми типами БД:
- NoSQL
- time-series (InfluxDB и аналоги)
- графовые базы данных
Нам важно не прикрутить LLM , а выстроить управляемые, предсказуемые и масштабируемые системы поиска и обработки данных, где AI модель лишь часть пайплайна.
Мы ищем middle+/senior ML инженера (multi-modal), который:
- умеет самостоятельно проектировать ML-решения
- способен предлагать архитектуру и альтернативы, искать решения
- Обладает энтузиазмом к делу, которым занимается
- Python
- Ollama (self-hosted модели)
- OpenRouter
- K8s
- SQL / NoSQL
- FFmpeg
- Модели: Qwen , Whisper , WhisperX . Мы активно ищем более эффективные альтернативы
- Проектирование сложных data / ML pipelines
Задачи
- Проектирование альтернатив RAG-подходам
- Работа с алгоритмами поиска и retrieval без жёсткой привязки к LLM
- Интеграция ML-пайплайнов с NoSQL / time-series / graph DB
- Проектирование и оптимизация сложных data-потоков
- Проектирование и развитие multi-modal ML-пайплайнов
- Интеграция и оптимизация моделей для обработки видео / аудио / изображений / текста
- Поиск, сравнение и внедрение более эффективных моделей
- Работа с self-hosted моделями (Ollama)
- Интеграция ML-части с backend-сервисами
Требования
- Опыт работы ML инженером от 3 5 лет
- Отличное знание Python
- Опыт работы с multi-modal моделями (text / audio / video / image)
- Понимание ML-пайплайнов end-to-end
- Базовое понимание k8s
- Опыт работы с SQL и NoSQL БД
- Способность самостоятельно принимать технические решения
- Понимание ограничений и проблем RAG-подходов
- Опыт проектирования search / retrieval систем
- Работа с time-series или графовыми БД
- Умение мыслить вне LLM-first парадигмы
Условия:
-
Участие в масштабных проектах по обработке данных и автоматизации бизнес-процессов
-
Содействие в развитии компании, возможность влиять на продукт и процессы компании,
-
Работа в инновационной команде
-
Достойная, конкурентоспособная заработная плата
-
Удаленная работа, редкие офлайн встречи в г.Санкт-Петербург
-
Возможность профессионального развития
Уважаемые соискатели!
В связи с большим количеством поступивших откликов время обработки может быть увеличено. Просим вас отнестись к этому с пониманием.