Data Scientist (LLM/NLP)

15 Июля

Партнерские Вакансии

Город:

Томск

Занятость:

Полная занятость

Компания "LOYMAX AI"

Мы создаём интеллектуального AI-консультанта нового поколения, который способен:
• Отвечать на сложные бизнес-вопросы на основе внутренних документов (RAG),
• Помогать пользователям через диалоговую систему,
• Генерировать специализированный код
• Проект совмещает передовые LLM-технологии , архитектуру Retrieval-Augmented Generation (RAG) и code generation models

Обязанности:

  • Разработка и оптимизация RAG-архитектуры (retriever + generator)
  • Интеграция LLM с векторными БД (FAISS, Qdrant, Weaviate и др.)
  • Обработка и семантический поиск по корпоративным базам знаний, PDF, Wiki, API-документации и т.д.
  • Разработка бота-помощника по генерации кода на основе user prompt'ов
  • Подбор и настройка моделей генерации кода (CodeLlama, Starcoder, DeepSeekCoder и др.)
  • Тестирование качества генерации: relevance, correctness, hallucination rate
  • Построение пайплайнов для извлечения, разметки и дообучения на кастомных датасетах
  • Визуализация результатов и сбор фидбэка от пользователей
  • Участие в A/B тестировании LLM-решений и построении метрик качества

Требования:

Обязательные:

  • Опыт в работе с LLM
  • Навыки разработки RAG-систем: опыт с LangChain, LlamaIndex или аналогичными
  • Знание Python, особенно в контексте NLP / ML / AI
  • Опыт работы с embedding-моделями (sentence-transformers, Instructor, E5, text-embedding)
  • Умение работать с векторными хранилищами (FAISS / Qdrant / Chroma)
  • Знание архитектуры генерации кода (CodeLlama, Codex, StarCoder и пр.)
  • Навыки работы с Rest API и умение работать с форматами JSON, Markdown, YAML
  • Знание Git, Docker, Linux[ЮГ1] , Flask / FastAPI

Желательно:

  • Опыт fine-tuning или LoRA-донастройки моделей
  • Знания в области Information Retrieval: BM25, hybrid search
  • Опыт работы с CI/CD, оркестрацией на Airflow или Dagster.
  • Опыт генерации и тестирования кода LLM-моделями (unit tests, code quality metrics)
  • Знание английского языка на уровне чтения технической документации и общения

Мы предлагаем:

  • Участие в прикладных и исследовательских LLM-проектах
  • Гибкий график, удалённую работу и команду, открытую к экспериментам
  • Поддержку в обучении: менторство, материалы, доступ к GPU
  • Быстрый рост и развитие компетенций
Похожие вакансии

16 Июля

PHP разработчик в команду Data mining

Томск

от 140 000 до 230 000 руб.

Компания "Drom" Чем предстоит заниматься на данной позиции: разрабатывать новые и поддерживать существующие сервисы оптимизировать код и...

Отправить резюме подробнее

07 Июля

Data Engineer Middle

Томск

Компания "Rubius" Компания Rubius занимается продажей услуг заказной разработки ПО крупным корпоративным клиентам. Наши ключевые направления:...

Отправить резюме подробнее

19 Июля

Технический писатель для Yandex DataBase

Томск

от 45 000 руб.

Компания "Yandex Crowd" Ищем технических писателей с опытом программирования или администрирования ИТ-инфраструктуры. Вам предстоит готовить...

Отправить резюме подробнее

21 Июля

Junior Data Scientist (Стажер)

Томск

Компания "Центр финансовых технологий" Приглашаем начинающих специалистов, которые хотят начать карьеру в команде ML, в бесплатный проект ШИФТ....

Отправить резюме подробнее

21 Июля

Аналитик данных (Data Analyst)

Томск

Компания "Национальный исследовательский Томский политехнический университет" Требования: высшее образование (магистратура/специалитет) в...

Отправить резюме подробнее

Вакансия размещена в отрасли

Информационные технологии / IT / Интернет: