«Машинное зрение распознает лица почти стопроцентно»
Материалы выпуска
Лицом к новой реальности Инновации «Машинное зрение распознает лица почти стопроцентно» Инструменты Фейс-контроль для покупателя Экспертиза
Инструменты
0
Материалы подготовлены редакцией партнерских проектов РБК+.
Материалы выпуска
Материалы выпуска
«Машинное зрение распознает лица почти стопроцентно»
О применении биометрии в ретейле, банках и на массовых мероприятиях, а также о новых мошенниках, пытающихся обмануть роботов, РБК+ рассказал гендиректор ЦРТ Дмитрий Дырмовский.
Фото: Анастасия Цайдер для РБК

— Сегодня активно развиваются технологии машинного зрения. Что нового происходит в этой отрасли?

— Качество подобных систем сильно выросло. В этой области трудится много исследовательских команд с разными базами фотографий.

Одни работают с фронтальными фотографиями из документов, кто-то специализируется на портретах из соцсетей. Третьи, как мы, преимущественно используют данные, получаемые на транспорте и с массовых мероприятий. И у многих проектов качество распознавания выросло почти до стопроцентного.

— Как этого удалось достичь?

— Все лидеры индустрии используют нейронные сети. Предыдущее поколение систем распознавания работало по так называемым фичам — выделялись характерные точки на лице, шло сравнение этих шаблонов. Анализ очень зависел от поворота головы и освещения.

«Нейронки» работают иначе. Они сами определяют особенности лица, слоями фильтруя изображение и формируя матрицу. Такой слепок занимает 2–4 килобайта, точно характеризует лицо и улучшается за счет постоянного самообучения на большом количестве фотографий. Такие сети минимизируют влияние угла поворота и освещения на точность распознавания и даже в очень плохих условиях дают хороший результат.

Для идентификации начинают использоваться и такие признаки, как форма ушей, головы, текстура кожи. Есть и парадоксальные тренды. На последней конференции в Лондоне всерьез рассматривались вопросы расизма в биометрии.

Дело в том, что компьютерные движки систем, сделанные в Европе, плохо работают с азиатскими лицами, и наоборот. А с афроамериканцами вообще никто толком не работает. В результате в Великобритании, где система лицевой биометрии развернута с размахом, полицейские из-за плохой работы алгоритмов задерживают много законопослушных афробританцев.

— Видеобиометрия будет массово применяться?

— Да. Самый очевидный кейс — безопасность, например на транспорте и массовых мероприятиях. Скажем, у нас в офисе сотрудники уже проходят не по карточкам на турникетах, а по лицам. Но безопасность — это не все. В ближайшее время мы увидим активное внедрение видеобиометрии в ретейле, в ресторанном и гостиничном бизнесе. Программы лояльности, таргетированная реклама, специализированные предложения — все это может дать биометрия.

Представьте, что при входе в магазин или банк показывают адресованную именно вам рекламу. Системы также могут подсказывать продавцу, какие два-три продукта вы любите. Естественно, все это позволит существенно повысить продажи, что бизнесу и нужно.

Следующим шагом также станет распознавание эмоций. Ушел клиент довольный или нет, положительно или отрицательно отреагировал, например, на рекламный ролик. Следом пойдет определение антропометрических параметров, когда в магазинах вам смогут предлагать коллекции, автоматически подходящие по размеру.

Например, у меня из-за большого роста в одежде европейских марок рукава обычно короче на 15 сантиметров, чем надо. С развитием технологий мне не надо будет пробовать все вещи подряд. А если мы говорим про онлайн-магазины без возможности примерки, то именно видеоаналитика будет соизмерять ваш размер с имеющимися в магазине размерами.

— Какие есть проблемы в этой индустрии?

— Самая главная — активизация мошенников. Один из последних известных примеров — вскрытие системы лицевой биометрии iPhone Х с помощью силиконовой маски за $150. Для противодействия таким мошенникам зарождается целая индустрия «антивирусных» программ нового типа, которые будут сильно востребованы по мере вовлечения в нашу жизнь интернета вещей.

— Что используют злоумышленники, кроме масок?

— Программные средства, позволяющие делать синтез одной фотографии из нескольких. Например, берут фотографию оригинала, мошенника и еще одного человека, накладывают, получается некий усредненный тип, визуально похожий на оригинал из документов. Любая система лицевой биометрии будет давать на таком синтезированном фото пороговые значения и, скорее всего, «пропустит» такого человека.

Надо сказать, этот синтез уже используется злоумышленниками в паспортах, и если человек из Азии проходит через границу в европейской стране, верифицировать с такой фотографией его будет сложно. Так что в ближайшие три—пять лет борьба с подделками в этой индустрии будет темой номер один.

— Есть уже наработки в области борьбы с подделками?

— Да, мы ведем такие разработки. Но хотел бы сказать, что похожие проблемы есть не только с лицевой биометрией, но и с голосовой. Злоумышленники могут, например, склеить на компьютере речь из ваших фраз, позвонить в банковский контакт-центр и попытаться, скажем, перевести деньги на свой счет от вашего имени.

Это особенно опасно в случае private banking, когда звонок идет менеджеру, знающему ваш голос. Или же, например, брокеру звонят от вашего имени с указанием продать определенные акции. Наши технологии позволяют выявлять, не является ли голос поддельным и сделанным из склеек. На международном соревновании Antispoofing Challenge ЦРТ выиграла конкурс, оказавшись лучшей в мире компанией, идентифицирующей подделки по голосу.

— С чем сложнее работать — с изображением или звуком?

— Со звуком. Во-первых, видеоконтента везде огромное количество, начиная от накопленных данных с камер наблюдения и заканчивая различными роликами из интернета, а также социальными сетями. Во-вторых, лицо, конечно, выглядит иначе в зависимости от наклона и освещения, но разница все же не настолько большая, как в случае с голосом.

Конечно, в телефонном разговоре все проще, но вот с акустикой на улице или в помещении все гораздо сложнее из-за большого количества шумов. Когда в кадре 20 лиц, система может их четко выделить. А когда в одном канале 20 голосов, эта задача тяжелейшая. Но ее решением мы активно занимаемся с коллегами из Института мозга человека РАН и Института высшей нервной деятельности и нейрофизиологии РАН, тем более что недавно ЦРТ получила крупный грант у государства на работы в этой отрасли, рассчитанный на несколько лет.

— Что это за работа?

— Речь о «дорожной карте» NeuroNet. Это национальная техническая инициатива, направленная на преодоление технологических барьеров в области машинного слуха. Ее задача — дать роботизированным системам возможность работать с полным контекстом того, что происходит в акустическом канале.

К примеру, анализировать сложную звуковую картину, отделять и расшифровывать речь от наложенных шумов, определять, что поет птица, шумит кондиционер. Нужно создать платформу, которая позволит большому количеству российских и западных разработчиков интернета вещей использовать технологии в своих продуктах. Надеюсь, что мы большую часть этих проблем сможем преодолеть.

— За рубежом такие разработки ведутся?

— Доподлинно мы этого не знаем. Но, судя по публикациям на профильных ресурсах, похожие акустические работы финансировали американские военные из DARPA. Так что не удивлюсь, если через какое-то время и они выбросят ряд технологий на коммерческий рынок.