Senior Data Scientist в команду NLP Search
2ГИСОписание
Какие задачи мы решаем
- Разрабатываем ML-модели для поиска и ранжирования организаций по пользовательским запросам;
- Улучшаем механизмы понимания и обработки поисковых запросов : сегментация текста, исправление опечаток, генерация автодополнений;
- Разрабатываем ML-модели для объяснимости выдачи : связывание товаров, услуг, атрибутов и отзывов с организациями;
- Делаем классификацию и кластеризацию запросов и организаций для повышения точности поиска;
- Разрабатываем ML-модели для саммаризации отзывов , извлечения фактов и других полезных данных из неструктурированных текстов.
Мы ждем, что Вы
- Работаете над NLP-задачами более 3 лет и имеете опыт реализации решений в реальных продуктах;
- Хорошо понимаете архитектуры современных моделей : BERT, T5, GPT и их вариаций знаете их сильные и слабые стороны;
- Владеете Python и уверенно работаете с PyTorch, HF Transformers и другими ключевыми ML/DL-библиотеками;
- Умеете строить полный ML-пайплайн : от исследований и обучения до вывода модели в продакшен и поддержки инференса;
- Работали с задачами semantic search, query understanding, извлечения embedding-представлений и reranking;
- Умеете оценивать качество поисковых систем : Recall@K, MRR, NDCG, как в offline, так и в A/B-тестах.
Будет крутым бонусом, если Вы
- Знаете принципы оптимизации ML/DL-моделей и использовали библиотеки Triton, FasterTransformer, ONNX и другие;
- Разрабатывали ML-модели для задач поиска и ранжирования , в частности системы генерации кандидатов и dense retrieval с использованием FAISS, Usearch, ColBERT;
- Имеете опыт взаимодействия с backend/infra : FastAPI, Docker, gRPC, Kafka, Clickhouse, Kubernetes;
- Работали с инструментами для разработки LLM инфраструктуры : LangChain, LoRA/PEFT, vLLM, SGLang и другие;
- Участвовали в исследовательских или pet-проектах в области NLP особенно приветствуются статьи, open-source и публичные демо.
Почему стоит к нам присоединиться
- Сложные задачи в реальном продукте миллионы пользователей, огромный справочник организаций, разнообразие и сложность данных;
- Свобода выбирать технологии мы используем передовые ML/NLP-инструменты и ищем лучшие решения;
- Влияние на продукт у вас будет возможность создавать полезные фичи, которые делают поиск лучше и помогают людям каждый день;
- Сильная команда с которой можно расти и масштабировать крутые ML-решения;
- Фокус на эксперименты много A/B-тестирования, исследовательской работы, поиск оптимальных архитектур;
- Современный стек PyTorch, Transformers, LangChain, Triton, ONNX, FastAPI, Kafka, Kubernetes.
Почему у нас классно
- 2ГИС аккредитованная IT-компания;
- Можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске;
- Само собой, полностью белая зарплата;
- Заботимся о здоровье: ДМС и возможность получать онлайн-консультации и терапевта, невролога, психолога и медицинского агента;
- Если хочешь делиться своим опытом, мы только за поможем с выступлениями на конференциях и статьями для Хабра/VC;
- Есть собственный учебный центр: курсы, тренинги и книги для прокачки скиллов.
день назад
Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии
Senior Data Scientist (ML/NLP)
Описание Объединённая компания Wildberries и Russ это международная технологическая компания, образованная в результате слияния двух лидеров рынка IT-компании Wildberries и оператора наружной рекламы ...
22.01.2026; Источник: hh.ru
Senior Data Scientist (Rec. system)
Описание Мы делаем рекомендательную систему, которая является одним из ключевых ML-сервисов в Okko. Простые задачи мы уже решили, остались интересные. Обязанности: исследование и реализация ...
28.01.2026; Источник: hh.ru
Senior Data Scientist
Описание Наши ожидания по стеку: Уверенное владение SQL; Уверенное владение языком Python; Знание и применение основных аналитических библиотек python: numpy, pandas, scipy, sklearn, matplotlib, ...
15.01.2026; Источник: hh.ru