Поиск лиц по фотографии

О проекте

О проекте
Необходима возможность поиска по фотографии имён актёров и фильмов с их участием.
Пользователи легко находят нужных актёров и фильмы с их участием. Как итог, больше проводят времени на сайте. Доход от рекламы увеличился.
Задача
Бизнес эффект
Внедрение функции, которая позволяет найти имена актёров по фотографии, что даёт возможность найти фильмы с участием этих актёров.
Решение
Путь пользователя
Как работает сервис?
Процесс, который включает в себя детекцию, выравнивание и векторизацию лица, при помощи библиотеки DeepFace.
Анализ лица конвертируется в цифровой код, который называют «отпечатком лица».
Поиск с помощью E-lasticsearch — базы данных, со встроенным алгоритмом HNSW из семейства ANN, благодаря которому, происходит быстрый и эффективный поиск.
Обнаружение и анализ лица
Конверсия данных
Поиск совпадений
Работа сервиса
Загрузка пользователем фотографии актёра на сайт
1
Отображение результатов: имя искомого актёра, фильмы с его участием
2
Технологии
Фреймворк для создания веб-приложений, благодаря которому, настраивается логика взаимодействия с нейросетью через интернет.
Flask
Flask
Переводит запросы, полученные от Nginx в формат, который может обрабатывать веб-приложение, а также обеспечивает выполнение кода при необходимости.
Gunicorn
Gunicorn
Ресурс для демонстрации визуальной составляющей после обучения нейросети. Благодаря Streamlit, заказчик может протестировать нейросеть перед запуском сервиса. Таким образом, продукт можно доработать, если результаты не устраивают.
Streamlit
Streamlit
Благодаря этой функции, модель обучается разделять в пространстве векторы, олицетворяющие людей так, что мы точно находим нужного человека среди похожих.
ArcFace
ArcFace
Docker — инструмент, в котором есть все необходимые библиотеки и программы для работы нейросети. Благодаря ему, нейросеть можно легко и просто запустить на любом компьютере.
Docker
Docker
Принимает все запросы из Интернета. Он может обрабатывать их очень быстро и, как правило, настраивается так, чтобы пропускать только те запросы, которые действительно должны поступить в веб-приложение.
Nginx
NginxNginx
Elasticsearch — это база данных, в которой есть встроенный алгоритм ANN, его нет в других базах.
ANN (Аpproximate Nearest Neighbor) — это алгоритм, благодаря которому происходит быстрый и эффективный поиск по огромному количеству примеров, используя вычислительные ресурсы
Elasticsearch
Elasticsearch
Команда проекта


Фрэнк Ш.
Проектное управление / Машинное обучение
Дмитрий И.
Машинное обучение / Аналитика данных и технологии
Сферы использования
Данную технологию можно применить для того, чтобы распознавать мошенников, которые пытаются выдать себя за другого человека при помощи поддельных документов. Идентификацию человека по фото можно использовать, если у компании есть база с фотографиями и информацией об их клиентах.
Мы на связи
Мы на связи!
Напишите нам для сотрудничества или если у вас возникли вопросы.