Проекты
Компьютерное зрение
Поиск лиц по фотографии
Внедрение функции, которая позволяет найти имена актёров по фотографии.
Обнаружение, сегментация и множество правил для определения повреждений
Модель для поиска структурных повреждений на малых объёмах изображений
Обнаружение частей велосипеда, сегментация и классификация
Обнаружение, сегментация и классификация с использованием обучения для определения частей велосипеда
Аннотирование изображений для проекта по компьютерному зрению
Аннотация с помощью bounding boxes, аннотирование для сегментациии и классификации
Сегментация объектов на фотографиях с дронов
  • используются публичные сегментированные снимки дронов
  • построение модели сегментации для поиска объектов различных классов: люди, велосипеды, крыши и др. (22 класса)

Контент-фото и -видео система AL

  • классификатор обучения для видео
  • сервис поиска лиц с гибким поиском тегов для изображений
  • реализация веб-сервиса для сайта
Скоринг и аналитика
Система страхового скоринга
  • разработка системного решения для клиентов с помощью моделей машинного обучения
  • перенос функциональности коммерческого ПО на современные опен-сурс библиотеки
  • сопровождение моделей до production
Оптимизация для продаж
  • решение нескольких оптимизационных задач для сферы продаж (поиск минимального количества тележек для поставщиков и покупателей)
  • возможность уменьшить траты для небольших компаний
Анализ графов для страховых компаний
  • граф в сетях питона
  • поиск мошенников среди клиентов
  • результаты перенесены в neo4j
  • neo4j была разработана до production
  • в проекте использовался graphSage
Прогноз смерти пациентов для больницы
  • построение моделей прогнозирования смертности (XGBoost, LGBM, optuna, XGBSE, pycox)
  • помогает увеличить продолжительность жизни пациентов
Прогнозирование для биржевых товаров
  • построение моделей для цен на металлы (pytorch forecasting, prophet, XGBoost, LSTM, greykite)
  • создание рекомендаций для покупки или продажи для менеджмента
Веб-скрейпинг
  • извлечение данных из различных источников (статьи, цены, контент)
  • автоматизация процессов скрейпинга и парсинга (airflow, cron)
  • разработка ETL-процессов и хранение данных

Разработка SQL и OLAP

  • мы построили базы данных SQL и кубы OLAP
  • разработана аналитика на основе технологии OLAP (аудит страхового портфеля, предложения по изменению цен, аналитические отчеты)
NLP проекты
Генератор статей для SEO-оптимизации
  • создание алгоритма для генерирования статей из различных областей
  • разработка веб-сервиса с API
  • NLP модели
  • модели различных трансформеров (GPT, GPT2, CTRL, BERT, XL, models)
Задачи классификации интернет-статей с помощью NLP
  • парсер статей
  • выполнение различных задач по тексту статьи (моделирование тематики текста, распознавание именованных сущностей, анализ тональности текста, классификатор спама, обнаружение ошибок, обобщение)
  • построение мета-модели для классификации текста
Различные NLP задачи для нефтегазовых компаний
  • построение большого графа внутренних email коммуникаций
  • разлиные задачи по тексту email писем (моделирование тематики письма, распознавание именованных сущностей, анализа тональности текста)
  • извлечение неформальных групп в компани, основываясь на тематике текста и сущностях
Наши сервера доступны бесплатно для проектов
IBM x 3960
1TB RAM
120 CPU cores
3 GPU 1080ti
IBM x 3960
3 GPU 1080ti
1TB RAM
120 CPU cores
1TB RAM
120 CPU cores
3 GPU 1080ti
Наши сервера доступны бесплатно для проектов
Социальные проекты
Обучающий курс Mail.ru - Geekbrains
  • разработан и запущен обучающий курс “Машинное обучение в бизнесе”
  • обучено более 150 студентов
You Tube-канал про науку о данных и разработку
  • более 50 обучающих видео (наука о данных, фронтенд, бэкенд, продукт менеджмент и дизайн)