Data Scientist/ Дата-сайентист (RAG/LLM/NLP)
06 Июня 2025

Город:
Томск
Занятость:
Полная занятость
Компания "МАГ Девелопмент"
Мы разрабатываем интеллектуальные системы на базе open-source LLM для автоматизации анализа структурированных и неструктурированных данных компании.
Основные направления:
- Создание RAG-решений для обработки текстовых данных (PDF, Word, базы данных) и изображений (сканы документов, таблицы);
- Интеграция NLP-моделей с внутренними сервисами для улучшения поддержки сотрудников и клиентов.
Мы предлагаем:
- Трудоустройство по ТК РФ, полную занятость, белую зарплату;
- Регулярное повышение зарплаты с ростом скиллов и по результатам работы;
- Гибкий старт рабочего дня, который вы выбираете сами;
- ДМС после испытательного;
- Формат работы на выбор: из дома или из офиса;
- Работу без KPI и тайм-трекингов;
- Полную оплату обучения;
- Удобный офис с пространствами для отдыха, приёма пищи, кофемашинами и плюшками;
- Компенсацию половины твоих трат на спорт.
В твои задачи будет входить:
- Разработка и оптимизация RAG-пайплайнов: векторизация данных, семантический/гибридный поиск, генерация ответов с использованием LLM;
- Извлечение текста из изображений и PDF-документов с помощью OCR (Tesseract, OpenCV);
- Интеграция моделей через API (FastAPI, REST) с корпоративными системами и базами данных (SQL);
- Обучение и адаптация open-source LLM (LLaMA, Gemma) под бизнес-задачи;
- Оптимизация качества работы моделей: снижение ошибок генерации, A/B-тестирование, оценка метрик (precision/recall).
Что важно:
- Фокус на практическое применение моделей;
- Умение работать с открытыми решениями и оптимизировать их под бизнес-задачи.
Мы ожидаем, что у тебя есть:
- Опыт разработки RAG-систем: работа с векторными БД (FAISS, ChromaDB), фреймворками (LangChain, LlamaIndex), chunking текста;
- Навыки в NLP: fine-tuning моделей (Hugging Face), предобработка текста (регулярные выражения, очистка данных);
- Работа с изображениями: базовый опыт в OCR (Tesseract, OpenCV), обработка PDF/Word;
- Уверенный Python: FastAPI, асинхронное программирование, Pandas;
- Понимание метрик ML: оценка качества поиска и генерации (precision/recall, ROUGE).
- Фокус на практическое применение моделей.
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
31 Мая
Томск
Компания "LOYMAX AI" Мы создаём интеллектуального AI-консультанта нового поколения, который способен: • Отвечать на сложные бизнес-вопросы на...
01 Июня
PHP разработчик в команду Data mining
Томск
от 140 000 до 230 000 руб.
Компания "Drom" Чем предстоит заниматься на данной позиции: разрабатывать новые и поддерживать существующие сервисы оптимизировать код и...
01 Июня
Python-разработчик Middle (LLM SOLUTIONS & AI INTEGRATION)
Томск
от 170 000 руб.
Компания "AI-SOLUTIONS" AI-Solutions Energy – стартап , специализирующийся на создании решений и приложений для энергетической отрасли. Мы...
05 Июня
Junior Data Scientist (Стажер)
Томск
Компания "Центр финансовых технологий" Приглашаем начинающих специалистов, которые хотят начать карьеру в команде ML, в бесплатный проект ШИФТ....
18 Мая
Томск
Компания "LOYMAX AI" Ищем Data-аналитика в инновационную команду технологий искусственного интеллекта ! Вас увлекает мир данных и аналитики?...
Вакансия размещена в отрасли