Проекты
Компьютерное зрение
Обнаружение, сегментация и множество правил для определения повреждений
Модель для поиска структурных повреждений на малых объёмах изображений
Обнаружение, сегментация и классификация с использовнием глубокого обучения для определения частей велосипеда
Обнаружение частей велосипеда, сегментация и классификация
Аннотирование изображений для проекта по компьютерному зрению
Аннотация с помощью bounding boxes, аннотирование для сегментациии и классификации
  • использоваются публичные сегментированные снимки дронов
  • построение модели сегментации для поиска объектов различных классов: люди, велосипеды, крыши и другие (22 класса)
Сегментация объектов на фотографиях с дронов
Content video and photo AL system
  • deep learning classifier for videos
  • face search service with elastic search
  • tagging for images ilmplementation of web service for site
Скоринг и аналитика
Система страхового скоринга
  • разработка системного решения для клиентов с помощью моделей машинного обучения
  • перенос функцинальности коммерческого ПО на современные опен сурс библиотеки
  • сопровождение моделей до продакшн
  • решение нескольких оптимизационных задач для сферы продаж (поиск минимумального количества тележек для с ограничениями для поставщиков и покупателей)
  • возможность уменьшить траты для небольших компаний
Оптимизация для продаж
Анализ графов для страховых компаний
  • граф в сетях питона
  • поиск мошенников среди клиентов
  • результаты перенесены в neo4j
  • neo4j была разработана до production
  • в проекте использовался graphSage
  • build models deaths prediction (XGBoost, LGBM, optuna, XGBSE, pycox)
  • helps to make life longer
Optimization for retail industry
Прогнозирование для биржевых товаров
  • построение моделей для цен на металлы (pytorch forecasting, prophet, XGBoost, LSTM, greykite)
  • создание рекомендаций для покупки или продажидля менеджмента
  • извлечение данных из различных источников (статьи, цены, контент)
  • автоматизация процессов скрейпинга и парсинга (airflow, cron)
  • разработка ETL-процессов и хранение данных
Веб скрейпинг
Time series prediction for commodities
  • build models for metal prices (pytorch forecasting, prophet, XGBoost, LSTM, greykite)
  • make buy and sell recommendations for management
NLP
Генератор статей для SEO-оптимизации
  • создание алгоритма для генерирования статей из различных областей
  • разработка веб-сервиса с API
  • NLP модели
  • модели различных трансформеров (GPT, GPT2, CTRL, BERT, XL, models)
  • парсер статей
  • выполнение различныех задач по тексту статьи (моделирование тематики текста, распознование именованных сущностей, анализ тональности текста, классификатор спама, обнаружение ошибок, обобщение)
  • построение мета модели для классификации текста
Задачи классификации интернет-статей с помощью NLP
Различные NLP задачи для нефтегазовых компаний
  • построение большого графа внутренних email коммуникаций
  • разлиные задачи по тексту email писем (моделирование тематики письма, распознавание именованных сущностей, анализа тональности текста)
  • извлечение неформальных групп в компани, основываясь на тематике текста и сущностях
Наши сервера доступны бесплатно для проектов
IBM x3960
  • 1TB RAM
  • 120 CPU cores
  • 3 GPU 1080ti
Социальные проекты
Обучающий курс Mail.ru - Geekbrains
  • разработан и запущен обучающий курс “Машинное обучение в бизнесе”
  • обучено более 150 студентов
Более 50 обучающих видео (наука о данных, фронтенд, бэкенд, продукт менеджмент и дизайн)
YouTube-канал про науку о данных и разработку