人脸相似度对比

本文探讨了如何将人脸照片转化为特征值进行分类的问题。通过机器学习的方法,利用训练集不断优化分类函数,实现对人脸的有效识别。介绍了从简单线性分类到复杂非线性分类的处理方法,并详细解释了softmax损失函数的应用。
摘要由CSDN通过智能技术生成

由清晰的人脸照转化出的像素值矩阵,应当设计出什么样的函数 f(x)转化为特征值呢?这个问题的答案依赖于分类问题。即,先不谈特征值,首先如何把照片集合按人正确地分类?这里就要先谈谈机器学习。机器学习认为可以从有限的训练集样本中把算法很好地泛化。所以,我们先找到有限的训练集,设计好初始函数 f(x;w),并已经量化好了训练集中 x->y。如果数据 x 是低维的、简单的,例如只有二维,那么分类很简单,如下图所示:

上图中的二维数据 x 只有方形和圆形两个类别 y,很好分,我们需要学习的分类函数用最简单的 f(x,y)=ax+by+c 就能表示出分类直线。例如 f(x,y)大于 0 时表示圆形,小于 0 时表示方形。

给定随机数作为 a,c,b 的初始值,我们通过训练数据不断的优化参数 a,b,c,把不合适的 L1、L3 等分类函数逐渐训练成 L2,这样的 L2 去面对泛化的测试数据就可能获得更好的效果。然而如果有多个类别,就需要多条分类直线才能分出,如下图所示:

这其实相当于多条分类函数执行与&&、或||操作后的结果。这个时候还可能用 f1>0 && f2<0 && f3>0 这样的分类函数,但如果更复杂的话,例如本身的特征不明显也没有汇聚在一起,这种找特征的方式就玩不转了,如下图所示,不同的颜色表示不同的分类,此时的训练数据完全是非线性可分的状态:

这个时候,我们可以通过多层函数嵌套的方法来解决,例如 f(x)=f1(f2(x)),这样 f2 函数可以是数条直线,而 f1 函数可以通过不同的权重 w 以及激励函数完成与&&、或||等等操作。这里只有两层函数,如果函数嵌套层数越多,它越能表达出复杂的分类方法,这对高维数据很有帮助。例如我们的照片毫无疑问就是这样的输入。所谓激励函数就是把函数 f 计算出的非常大的值域转化为[0,1]这样较小的值域,这允许多层函数不断地前向运算、分类。

前向运算只是把输入交给 f1(x,w1)函数,计算出的值再交给 f2(y1,w2)函数,依次类推,很简单就可以得到最终的分类值。但是,因为初始的 w 权重其实没有多大意义,它得出的分类值 f*(x)肯定是错的,在训练集上我们知道正确的值 y,那么事实上我们其实是希望 y-f*(x)的值最小,这样分类就越准。这其实变成了求最小值的问题。当然,y-f*(x)只是示意,事实上我们得到的 f*(x)只是落到各个分类上的概率,把这个概率与真实的分类相比较得到最小值的过程,我们称为损失函数,其值为 loss,我们的目标是把损失函数的值 loss 最小化。在人脸识别场景中,softmax 是一个效果比较好的损失函数,我们简单看下它是如何使用的。

比如我们有训练数据集照片对应着 cat、dog、ship 三个类别,某个输入照片经过函数 f(x)=x*W+b,前向运算得到该照片属于这 3 个分类的得分值。此时,这个函数被称为得分函数,如下图所示,假设左边关于猫的 input image 是一个 4 维向量[56,231,24,2],而 W 权重是一个 4*3 的矩阵,那么相乘后再加上向量[1.1,3.2,-1.2]可得到在 cat、 dog、ship 三个类别上的得分:

从上图示例可见,虽然输入照片是猫,但得分上属于狗的得分值 437.9 最高,但究竟比猫和船高多少呢?很难衡量!如果我们把得分值转化为 0-100 的百分比概率,这就方便度量了。这里我们可以使用 sigmoid 函数,如下图所示:

从上图公式及图形可知,sigmoid 可以把任意实数转换为 0-1 之间的某个数作为概率。但 sigmoid 概率不具有归一性,也就是说我们需要保证输入照片在所有类别的概率之和为 1,这样我们还需要对得分值按 softmax 方式做以下处理:

这样给定 x 后可以得到 x 在各个类别下的概率。假定三个类别的得分值分别为 3、1、-3,则按照上面的公式运算后可得概率分别为[0.88、0.12、0],计算过程如下图所示:

然而实际上 x 对应的概率其实是第一类,比如[1,0,0],现在拿到的概率(或者可称为似然)是[0.88、0.12、0]。那么它们之间究竟有多大的差距呢?这个差距就是损失值 loss。如何获取到损失值呢?在 softmax 里我们用互熵损失函数计算量最小(方便求导),如下所示:

其中 i 就是正确的分类,例如上面的例子中其 loss 值就是 -ln0.88。这样我们有了损失函数 f(x)后,怎么调整 x 才能够使得函数的 loss 值最小呢?这涉及到微分导数。

深度学习人脸相似度检测

MICROSOFT 基础类库: 人脸相似度检测MFC 项目概述 =============================================================================== 应用程序向导已为您创建了这个 人脸相似度检测MFC 应用程序。此应用程序不仅演示 Microsoft 基础类的基本使用方法,还可作为您编写应用程序的起点。 本文件概要介绍组成 人脸相似度检测MFC 应用程序的每个文件的内容。 人脸相似度检测MFC.vcproj 这是使用应用程序向导生成的 VC++ 项目的主项目文件。 它包含生成该文件的 Visual C++ 的版本信息,以及有关使用应用程序向导选择的平台、配置和项目功能的信息。 人脸相似度检测MFC.h 这是应用程序的主要头文件。它包括其他项目特定的头文件(包括 Resource.h),并声明 C人脸相似度检测MFCApp 应用程序类。 人脸相似度检测MFC.cpp 这是包含应用程序类 C人脸相似度检测MFCApp 的主要应用程序源文件。 人脸相似度检测MFC.rc 这是程序使用的所有 Microsoft Windows 资源的列表。它包括 RES 子目录中存储的图标、位图和光标。此文件可以直接在 Microsoft Visual C++ 中进行编辑。项目资源位于 2052 中。 res\人脸相似度检测MFC.ico 这是用作应用程序图标的图标文件。此图标包括在主要资源文件 人脸相似度检测MFC.rc 中。 res\MFC.rc2 此文件包含不在 Microsoft Visual C++ 中进行编辑的资源。您应该将不可由资源编辑器编辑的所有资源放在此文件中。 ///////////////////////////////////////////////////////////////////////////// 应用程序向导创建一个对话框类: 人脸相似度检测MFCDlg.h,人脸相似度检测MFCDlg.cpp - 对话框 这些文件包含 C人脸相似度检测MFCDlg 类。该类定义应用程序主对话框的行为。该对话框的模板位于 人脸相似度检测MFC.rc 中,该文件可以在 Microsoft Visual C++ 中进行编辑。 ///////////////////////////////////////////////////////////////////////////// 其他功能: ActiveX 控件 应用程序包括对使用 ActiveX 控件的支持。 ///////////////////////////////////////////////////////////////////////////// 其他标准文件: StdAfx.h,StdAfx.cpp 这些文件用于生成名为 人脸相似度检测MFC.pch 的预编译头 (PCH) 文件和名为 StdAfx.obj 的预编译类型文件。 Resource.h 这是标准头文件,它定义新的资源 ID。 Microsoft Visual C++ 读取并更新此文件。 人脸相似度检测MFC.manifest 应用程序清单文件供 Windows XP 用来描述应用程序 对特定版本并行程序集的依赖性。加载程序使用此 信息从程序集缓存加载适当的程序集或 从应用程序加载私有信息。应用程序清单可能为了重新分发而作为 与应用程序可执行文件安装在相同文件夹中的外部 .manifest 文件包括, 也可能以资源的形式包括在该可执行文件中。 ///////////////////////////////////////////////////////////////////////////// 其他注释: 应用程序向导使用“TODO:”指示应添加或自定义的源代码部分。 如果应用程序在共享的 DLL 中使用 MFC,则需要重新发布这些 MFC DLL;如果应用程序所用的语言与操作系统的当前区域设置不同,则还需要重新发布对应的本地化资源 MFC90XXX.DLL。有关这两个主题的更多信息,请参见 MSDN 文档中有关 Redistributing Visual C++ applications (重新发布 Visual C++ 应用程序)的章节。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值