Достоинства и недостатки

Рассмотренные нейросетевые методы обеспечивают быстрое и надёжное распознавание изображений. Однако при применении этих методов к изображениям трёхмерных объектов возникают трудности, связанные с пространственными поворотами и изменением условий освещённости.

а

б

в

Рис. 3. С точки зрения классифицирующей системы (в) больше похоже на (б) чем на (а)

Рис. 4. Изображения одного и того же лица существенно различается при изменении освещения.

Изображения для различных углов поворота объекта существенно различаются, часть информации на изображении теряется, возникает новая, специфическая для данного угла. Например, лицо, повёрнутое на некоторый угол, с точки зрения классифицирующей системы [16] больше похоже на лицо другого человека, повёрнутое на такой же угол, чем на нужное лицо, изображённое в фас (рис. 3). Аналогичная проблема с изменением освещения (рис. 4). Такие ограничение обычно преодолеваются путём предъявления всевозможных вариаций изображения (различные повороты и освещённость) при обучении, но построение такого обучающего набора – трудная задача, и чаще всего такие наборы недоступны. Как показывает мировой опыт, эти проблемы не могут быть полностью решены выбором исходного представления данных. Поэтому к классифицирующим системам предъявляется требование – имея конечный репрезентативный набор вариаций образов некоторых классов, обобщить свой опыт на все остальные классы, не входившие в обучающий набор. Т.е. система должна извлечь характеристики, инвариантные к внутриклассовым изменениям и максимально репрезентативные по отношению к межклассовым изменениям. Такая задача в общем виде для систем распознавания лиц ещё не решена, но существуют методы, которые показывают возможности решения отдельных её аспектов [17,18] (инвариантность к освещению, синтез повёрнутых в пространстве изображений лиц на основе обучения). Перспективный подход в этом направлении описан в [10].

Так же существуют трудности, связанные с внутриклассовыми вариациями. Для лиц это различные эмоции, закрытые/открытые глаза, наличие очков и бород, изменения в причёске. Эти случаи система так же должна уметь обобщать.

В общем случае, при распознавании человек использует информацию от различных источников, и кроме того привлекает огромный запас контекстных знаний, который системам распознавания образов пока недоступен.

Заключение

Дан обзор различных нейросетевых методов распознавания изображений. Рассмотрены достоинства и недостатки этих методов при распознавании двумерных и трёхмерных объектов. Указаны проблемы при распознавании трёхмерных объектов. Выделены перспективные направления в распознавании трёхмерных объектов. Отмечены возможности применения нейросетевых методов для задачи распознавания человека по изображению лица.

Дополнительно

Численная модель эволюции плавающих на сферической мантии и взаимодействующих континентов
С развитием методов численного моделирования глобальных геодинамических процессов появилась возможность исследовать механизм дрейфа континентов с периодическим объединением их в суперконтиненты типа Пангеи. В предыдущих работах авторов разработан метод численного решения системы уравнений переноса ...

Автоматизированное проектирование станочной оснастки
1.1. СТАНОЧНЫЕ ПРИСПОСОБЛЕНИЯ . КЛАССИФИКАЦИЯ , ВИДЫ . 1.1.1. Станочные приспособления . Основную группу технологической оснастки составляют приспособления механосборочного производства. Приспособлениями в машиностроении называют вспомогательные устройства к технологич ...

Меню сайта