Оценка возраста на основании видеопоследовательности

Носов Глеб Юрьевич/Nosov Gleb Yurievich магистрант, кафедра программного обеспечения информационных технологий, факультет компьютерных систем и сетей, Белорусский Государственный Университет Информатики и Радиоэлектроники, г. Минск

 

Аннотация: актуальность выбранной темы обусловлена необходимостью автоматического распознавания возраста человека при построении систем обработки биометрической информации.

Abstract: the relevance of this topic chosen due to the need of automate human age estimation by facial images in constructing systems for processing biometric information.

Ключевые слова: машинное обучение, обработка изображений, распознавание лиц, оценка возраста, фильтры Габора, машина опорных векторов,

Keywords: machine learning, image processing, face recognition, age estimation, Gabor filters, SVM

Возрастающий интерес к проблеме оценки возраста человека привел к появлению множества алгоритмов, по оценке возраста. Внимание большинства исследователей привлекло использование AAM (Active appearance model) для получения информации о ключевых точках лица. На основании AAM был построен эффективный алгоритм оценки возраста AGES, проецирующий вектор свойств лица в индивидуальный шаблон взросления. В то же время использование AAM затруднено при обработке видеопоследовательности, по причине медленной работы AAM. В данной работе рассматривается подход к оценке возраста человека на основании видеопоследовательности в реальном времени.

При попытке автоматического распознавания возраста человека возникает ряд сложностей, затрудняющих построение автоматической системы.

Процесс взросления неконтролируем, это означает, что: люди не могут изменить свой возраст по желанию; взросление медленно и необратимо; сбор обучающей выборки для оценки возраста является очень трудоемким и долгим занятием. Как результат доступные наборы данных для обучения содержат ограниченное число изображений одного и того же человека в разном возрасте, а также изображения людей в старости являются весьма редкими.

Эффекты взросления индивидуальны для людей и зависят от множества факторов независящих от человека, таких как пол и наследственность, а также зависящих от человека: здоровье, образ жизни, курение, погодные условия, рабочие условия и пр. Как результат отсутствует однозначное отношение черт лица к возрасту человека.

Для обучения классификатора будем использовать базу MORPH, собранную группой изучения старения лиц. Данная база содержит 55608 изображений 13673 человек в возрасте от 16 до 99 лет.

Для эффективного получения оценки возраста человека на основании видеопоследовательности необходимо иметь возможность выделять лицо из отдельно взятого кадра. После того, как лицо найдено необходимо нормализовать изображение, а именно: устранить поворот лица, привести размер лица к масштабу, который ожидается на входе функцией, по оценке возраста.

Для обнаружения лица целесообразно использовать каскадный классификатор, основанный на свойствах Хаара. Свойства Хаара представляют собой прямоугольные области, разделённые на положительные и отрицательные области. Для обнаружения лиц такой классификатор используется совместно с алгоритмом скользящего окна. Алгоритм скользящего окна использует так называемую пирамиду изображений для обнаружения лиц различного размера [1].

Также важным шагом является приведение лиц к единому масштабу, а также компенсация поворота. Для проведения этих операций требуются некоторые ключевые точки, относительно которых будут применяться преобразования. Целесообразно в качестве подобных точек использовать глаза. Для компенсации поворота следует повернуть изображение таким образом, чтобы отрезок, соединяющий глаза, был расположен горизонтально. Для приведения к единому масштабу следует изменять размер лица до тех пор, пока отрезок, соединяющий глаза не будет иметь фиксированную длину M.

При проведении оценки возраста будем определять возрастную группу человека, а именно детей (младше 15 лет), молодежи (16-25 лет), людей среднего возраста (26-55 лет) и пожилых людей) старше 56 лет. Данную задачу можно представить, как классическую задачу систем машинного обучения: определение класса, к которому относится набор данных. Для решения данной задачи обучим каскад из машин опорных векторов (SVM) , каждая из которых проводит бинарную классификацию.

Для обучения SVM будем использовать признаки, полученные при применении фильтров Габора с различной длиной волны (1.17, 1.65, 2.33, 3.30, 4.67) и ориентацией (0, 45 … 315). Фильтры Габора зачастую используются в обработке изображений для выделения границ. С учетом того, что старение лица тесно связано с изменением границ/формы лица и появлением морщин данный выбор является целесообразным. Применение банка фильтров Габора к изображению размера 40*40 пикселей приведет к появлению 64000 признаков.

Учитывая ограниченность набора обучающих данных следует уменьшить пространство признаков, чтобы избежать переобучения системы. Для уменьшения пространства признаков воспользуемся критерием согласия Колмогорова-Смирнова. Данный критерий позволяет оценить корреляцию между двумя распределениями. Чтобы иметь возможность сравнить распределения необходимо сгенерировать распределение вероятности отнесения к требуемой возрастной группе в зависимости от свойства F(n). Для этого возможно обучить SVM на одном признаке, и классифицировать обучающую выборку. Проведя сравнение распределений с помощью критерия Колмогорова-Смирнова выберем 2500 признаков, наилучшим образом описывающих возраст человека.

Машина опорных векторов проецирует исходное пространство признаков в пространство большей размерности при помощи функции ядра. На данный момент не существует общего подхода к выбору функции ядра, позволяющей спроецировать вектор признаков в пространство большей размерности. Наиболее часто используемыми функциями ядра являются: полиномиальная функция (x * y)d; функция радиального базиса exp(-γ||x – y||2), для γ < 0; гиперболический тангенс tanh(kx*y + c). Выбор оптимальной функции ядра и её параметров следует осуществлять через построение множества классификаторов и выбор лучшего из них. При обучении машины опорных векторов для оценки возраста на основе базы данных MORPH наилучших результатов оценки возраста удалось достигнуть при использовании полиномиальной функции ядра второй степени. Достигнутая точность оценки возрастной группы составила 91%.

Литература

  1.      Семенюта С., Туляков С., Носов Г., Садыхов Р. SURF descriptors for face recognition // The 7th International Conference on Neural Network and Artificial Intelligence: межд. конф. (Минск, 10 – 12 октября 2012). Минск: Изд-во БГУИР, 2012. C. 138–141.


Публикация научной статьи. Пошаговая инструкция

telemarketer

Есть вопрос? Задайте его Вашему персональному менеджеру. Служба поддержки призвана помочь пользователям в решении любых проблем, связанных с вопросами публикации своих работ и другими аспектами работы издательства «Проблемы науки».

 
Интересная статья? Поделись ей с другими:

Добавить комментарий


Защитный код
Обновить

Издательство «Проблемы науки» Наши авторы Оценка возраста на основании видеопоследовательности
Яндекс.Метрика Импакт-фактор российских научных журналов Принимаем Z-Payment www.megastock.ru