Data engineer DWH в Маркет

Яндекс
Санкт-Петербург Опыт работы от 1 года Постоянная занятость Полный день
Поделиться

Описание

Яндекс Маркет один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам развивать свой бизнес, повышая продажи и привлекая новых клиентов.

Мы команда инженеров данных, и продукт нашей команды Data WareHouse (хранилище данных), которое мы строим для нужд бизнес-подразделений. Нашими пользователями являются как руководители Маркета, которым нужна отчётность для принятия решений, так и эксперты в области глубокого анализа данных. Можно утверждать, что все бизнес-подразделения Маркета являются потребителями поставляемых нами данных.

Технологически ядро хранилища построено на системах хранения данных YTsaurus и СlickHouse. Разработка процессов ETL идёт на собственном фреймворке, который создан внутри Яндекса.

Наше хранилище данных сейчас одно из самых крупных в России порядка 30 петабайт и с учётом темпов роста бизнеса оно будет самым большим. Стоит отметить, что к нему предъявляются высокие требования по надёжности, что ставит перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.

Какие задачи вас ждут

  • вести разработку ETL-процессов поставки данных;
  • выявлять неэффективность в существующих процессах и оптимизировать их;
  • проектировать структуру хранения данных;
  • участвовать в развитии фреймворка поставки данных;
  • погружаться в данные одной из прикладных бизнес-областей и становиться в них экспертом;
  • сопровождать разработанные процессы ETL.

Мы ждём, что вы

  • уверенно знаете Python на уровне написания собственного фреймворка и SQL на уровне оптимизации запросов;
  • знаете основные алгоритмы и структуры данных, особенно используемые в области работы с большими данными.

Будет плюсом, если вы

  • проектировали DWH: слои, модели хранения данных, процессы ETL;
  • понимаете принципы работы хотя бы одной технологии распределенной обработки данных: Hadoop, ClickHouse;
  • имеете опыт промышленной разработки на одном из языков высокого уровня: Java или C++;
  • умеете работать в командной строке систем Unix-like: Linux, macOS.
21 час назад Источник: hh.ru
Обращаем Ваше внимание, что вакансия взята с внешнего источника hh.ru. Администрация сайта не несет ответственность за ее содержание.
Рекомендуемые вакансии

Data Engineer (Офис в Спб)

  • Bell Integrator
  • Санкт-Петербург
Описание Компания Bell Integrator ищет хорошего специалиста на вакансию Data Engineer (Офис в Спб) . Санкт-Петербург (Россия). Полный рабочий день. Требуемые навыки: #middle, #Python, #ApacheSpark. ...
12.01.2026; Источник: career.habr.com

ML Engineer RecSys в Маркет

  • Яндекс
  • Санкт-Петербург
Описание Команда рекомендаций Яндекс Маркета делает персональные рекомендации товаров на главной странице, подбирает похожие и сопутствующие товары в карточке товара, а также персонализирует поиск. ...
14.01.2026; Источник: hh.ru

Analytics Engineer / Data Engineer

  • PLC.01
  • Санкт-Петербург
Описание Мы Place.01 российская аккредитованная айти-компания полного цикла, разрабатывающая финтех-решения. В нашей команде 200+ сотрудников в области разработки и маркетинга. В команду ищем Data ...
20.01.2026; Источник: hh.ru