Data Scientist (LLM/NLP)
15 Июля 2025

Город:
Томск
Занятость:
Полная занятость
Компания "LOYMAX AI"
Мы создаём интеллектуального AI-консультанта нового поколения, который способен:
• Отвечать на сложные бизнес-вопросы на основе внутренних документов (RAG),
• Помогать пользователям через диалоговую систему,
• Генерировать специализированный код
• Проект совмещает передовые LLM-технологии , архитектуру Retrieval-Augmented Generation (RAG) и code generation models
Обязанности:
- Разработка и оптимизация RAG-архитектуры (retriever + generator)
- Интеграция LLM с векторными БД (FAISS, Qdrant, Weaviate и др.)
- Обработка и семантический поиск по корпоративным базам знаний, PDF, Wiki, API-документации и т.д.
- Разработка бота-помощника по генерации кода на основе user prompt'ов
- Подбор и настройка моделей генерации кода (CodeLlama, Starcoder, DeepSeekCoder и др.)
- Тестирование качества генерации: relevance, correctness, hallucination rate
- Построение пайплайнов для извлечения, разметки и дообучения на кастомных датасетах
- Визуализация результатов и сбор фидбэка от пользователей
- Участие в A/B тестировании LLM-решений и построении метрик качества
Требования:
Обязательные:
- Опыт в работе с LLM
- Навыки разработки RAG-систем: опыт с LangChain, LlamaIndex или аналогичными
- Знание Python, особенно в контексте NLP / ML / AI
- Опыт работы с embedding-моделями (sentence-transformers, Instructor, E5, text-embedding)
- Умение работать с векторными хранилищами (FAISS / Qdrant / Chroma)
- Знание архитектуры генерации кода (CodeLlama, Codex, StarCoder и пр.)
- Навыки работы с Rest API и умение работать с форматами JSON, Markdown, YAML
- Знание Git, Docker, Linux[ЮГ1] , Flask / FastAPI
Желательно:
- Опыт fine-tuning или LoRA-донастройки моделей
- Знания в области Information Retrieval: BM25, hybrid search
- Опыт работы с CI/CD, оркестрацией на Airflow или Dagster.
- Опыт генерации и тестирования кода LLM-моделями (unit tests, code quality metrics)
- Знание английского языка на уровне чтения технической документации и общения
Мы предлагаем:
- Участие в прикладных и исследовательских LLM-проектах
- Гибкий график, удалённую работу и команду, открытую к экспериментам
- Поддержку в обучении: менторство, материалы, доступ к GPU
- Быстрый рост и развитие компетенций
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
16 Июля
PHP разработчик в команду Data mining
Томск
от 140 000 до 230 000 руб.
Компания "Drom" Чем предстоит заниматься на данной позиции: разрабатывать новые и поддерживать существующие сервисы оптимизировать код и...
07 Июля
Томск
Компания "Rubius" Компания Rubius занимается продажей услуг заказной разработки ПО крупным корпоративным клиентам. Наши ключевые направления:...
19 Июля
Технический писатель для Yandex DataBase
Томск
от 45 000 руб.
Компания "Yandex Crowd" Ищем технических писателей с опытом программирования или администрирования ИТ-инфраструктуры. Вам предстоит готовить...
21 Июля
Junior Data Scientist (Стажер)
Томск
Компания "Центр финансовых технологий" Приглашаем начинающих специалистов, которые хотят начать карьеру в команде ML, в бесплатный проект ШИФТ....
21 Июля
Аналитик данных (Data Analyst)
Томск
Компания "Национальный исследовательский Томский политехнический университет" Требования: высшее образование (магистратура/специалитет) в...
Вакансия размещена в отрасли