17.4.17 漫画与人脸识别（一）

最新推荐文章于 2024-04-24 09:52:12 发布

MQTXWD

最新推荐文章于 2024-04-24 09:52:12 发布

阅读量6.2k

点赞数

分类专栏：人脸识别文章标签：人脸识别

本文链接：https://blog.csdn.net/u011732139/article/details/70210996

版权

人脸识别专栏收录该内容

17 篇文章

订阅专栏

本文探讨了漫画在人脸识别领域的应用，分析了漫画如何放大人物显著特征，以及如何利用这些特征改进人脸识别技术。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

从以往的人脸识别的学习中，知道目前对于机器而言，他们无法做对于夸张的人脸肖像进行识别。最近读到了一篇关于人脸肖像的识别问题，来了兴趣。

话不多话，漫画想必大家都应该看过，就算是同一个人也会有不同风格的肖像漫画图。如下所示。
这里写图片描述

从上面的四张图片中可以看出，不同风格的肖像图能够突出不同的人脸部分的特征。

对于这种类型的人脸肖像图，人能够比较容易辨认出该图片属于哪个人，但是对于机器而言，则具有一定的挑战性。麻省理工学院视觉研究实验室分析由几十名艺术家创作的数百幅肖像漫画，从而找到那些对于面孔识别最为重要的面部比例。上图显示了部分关键的面孔识别参数，比如两个瞳孔之间的距离；下嘴唇到下巴之间的距离；额头的面积等等。
人脸识别是人类比较擅长的技能之一，那么如何让机器也能够获得同样的能力？答案也可可以从漫画中获得。漫画的特点是放大人物的某些显著特征，但有种说法，好的漫画甚至比照片更像本人。因为它抓住了大脑捕捉的关键面部特征。那么有哪些特征是识别面孔的关键呢？
我们的大脑是灵敏到令人惊奇的机器，而识别面孔可能是它最擅长的。在出生几小时后，新生儿的眼睛就被类似面孔的图形所吸引。成年人的大脑只需100毫秒就能判断它看到的是一张面孔，只需要1秒多一点的时间就能识别两张光照条件、角度完全不同的面部照片。神经学家认为在人脑中有一个特别的区域———颞叶梭状回———专门用于面孔识别。
或许，最能说明我们出色的面孔识别能力的当属漫画，哪怕是在几秒钟内勾勒出线条简单人物漫画，也能轻易被我们的大脑识别。人们说，好的漫画比照片更像本人。虽然听上去不可思议，但这一点确实得到研究的证实。在视觉科学领域甚至有一个形容这一现象的专业名词———漫画效应。
人的面孔大同小异：嘴巴上一个鼻子，再上面是两个眼睛，人与人之间的面部特征差别通常只有几毫米。因此，我们的大脑重点寻找的是显著特征，也就是和我们头脑中的理想面孔(我们所见过的所有面孔的平均值)差异最大的地方。换句话说，为了击败视觉专家所谓的雷同问题，我们强调最重要的特征，忽略次要特征。我们对面孔的认知专注于朝天鼻、凹陷的眼睛或是肉乎乎的脸颊，在头脑中将它们夸大。为了识别并记住别人，我们把他们的面孔变成了漫画。
面孔识别科学原本只是人工智能领域一个停滞不前的课题，十年前突然成了事关国家安全的大事。9·11主谋穆罕默德·阿塔经过波特兰机场时被监控录像拍下的模糊画面让美国公众震怒，深受刺激的政客们纷纷拨款资助自动面孔识别系统的研究。人们都以为，几年之内，当所有监控摄像头都配备面孔识别软件后，人群中的每张面孔都会无比突出，它们将像独一无二的指纹一样立刻和嫌疑犯数据库进行对比。
是否听说有一个视觉科学家只用漫画家做实验对象？麻省理工学院视觉研究实验室主任帕万·辛纳是全美最前卫的电脑视觉研究者之一，他深知幽默、古怪、夸张是漫画的本质。他自己偶尔也为学校刊物创作漫画。但辛纳也认为，这些简单的、夸张的画作能够被客观地系统地研究，并帮助揭示人类和机器视觉的秘密。今年，他的实验室准备用计算机分析几十位漫画家创作的几百幅漫画，希望从中找到漫画家们的直觉知识———对于面孔识别，什么特征是最重要的，什么不重要。他将这个工作命名为赫尔希菲尔德计划，得名于著名的《纽约时报》漫画家阿尔·赫尔希菲尔德。
简单地说，赫尔希菲尔德计划逆向分析漫画家的创作过程。通过分析漫画，辛纳希望找到那些反复出现的夸张部分。他认为，最终将得到20多种对于面部识别最为重要的面部特征，以及它们各自的重要程度。辛纳说，“这将是揭开面孔密码的配方。”在初步实验中，实验室已经分离出一些重要元素———比如，鼻子根部与嘴巴的距离和前额高度之比。辛纳决定将它们命名为赫尔希菲尔德特征。
在任意一张面孔上，和标准面孔相比，20种赫尔希菲尔德特征中有4个的值偏大。在另一张面孔上，可能是另外几个特征大于平均值。但是无论在哪种情况下，关键都在于抓住夸大的部分。今天的现实是，自动面孔识别系统必须将目标面孔和视频中几百万张不停在运动的面孔进行比较。但是，迄今为止，面对种种目不暇接的变数，软件不知道到底该比较什么。通过赫尔希菲尔德特征，辛纳希望计算机能关注那些对于面孔识别最为重要的特征，排除其他干扰因素。