Генерация синтетических изображений для обучения системы машинного зрения

О проекте

Требовалась контролируемая генерация больших объемов изображений для обучения систем машинного зрения.

Ценность идеи

Избежание конфиденциальности и безопасности
Для некоторых задач реальные данные могут содержать конфиденциальную информацию. Сгенерированные данные решают эту проблему.
Контроль условий
Можно точно задать параметры сценария, включая освещение, фон, цвет, текстуры и другие характеристики, что позволяет проверять поведение нейронной сети в различных условиях.
Быстрая аннотация данных
Поскольку сгенерированные данные уже аннотированы, это сокращает время подготовки данных для обучения.
Разнообразие данных
Сгенерированные изображения позволяют создавать разнообразные наборы данных, что особенно важно, когда реальных данных ограниченное количество.
Создание изображений с помощью современных технологий для обучения нейросетей имеет ряд преимуществ:
Сгенерированные изображения процесса строительства для обучения нейросети определять нарушения техники безопасности

Сложности решения

В процессе работы возникают проблемы, требующие решения для дальнейшего использования продукта:
  • Нереалистичность изображений (особенно в медицинской графике)
  • Возможность плохого переноса на реальные данные
  • Некорректность аннотаций
Например, для реалистичной генерации синтетических документов (паспорт, водит. права и пр.), необходимо предусмотреть разделение данных и фотографий на мужской и женский пол, а также учитывать возраст при генерации.
Сгенерированный паспорт с некорректным именем. В ряде случаев учитывать этот параметр нет необходимости.

О разработке

Для решения задачи использовалось 3D моделирование.
Этапы работы:
1. Установка общей композиции сцены. Создание окружения.
2. Моделирование объектов с разным уровнем детализации.
3. Формирование пользовательских текстур, применение их и процедурных текстур к сцене и объектам.
4. Анимация камеры.
5. Рендеринг изображений и их маркировка с использованием специально разработанного сценария.

Сферы использования кейса

Генерация синтетических изображений для обучения систем КЗ представляет собой мощный инструмент и может иметь успешное применение в случаях где требуется:
  • Генерация фотографий где затруднительно получить достаточно реальных изображений: конфиденциальные сферы или необходимость создания редких или специфических сценариев
  • Генерация в условиях ограничения времени и ресурсов
  • Расширение набора данных относительно имеющихся

Команда проекта

Алексей В.
Разработчик
Мы на связи!
Напишите нам для сотрудничества или если у вас возникли вопросы.