应用于素描人脸识别的迁移学习

论文————Composite Sketch Recognition via Deep Network - A Transfer Learning Approach
2015年
论文中使用了由稀疏栈自编码器(stacked sparse antoencoder )和深度置信网络(Deep Belief Network)结合的网络,采用layer by layer unsupervised training的训练方法更新权重。非监督训练提取特征,监督训练计算matching score 。具体步骤如下:
首先,由于稀疏栈自编码器本身对噪声具有较强的鲁棒性,深度置信网络本身有较强的学习表征的能力,故而将两者连接起来,组成一个新的深度学习网络,用来提取脸部的一般特征。
自编码器
在这里插入图片描述如上图所示,自编码器就是通过一个隐藏层得到特征向量后,将其解码,与原输入特征进行对比,更新权重。而栈自编码器则是有多个隐藏层,且每一个隐藏层的输入都是前面的一层,训练方式是逐层训练。最终得到一个良好的特征。

深度置信网络(DBN)
DBN由多个RBM((限制玻尔兹曼机)组成。RBM跟AE(自编码器)很相似。
相似点在于:参数都由权重、偏置项构成;都可以reconstruct,使得输入和重构之间的差异性最小。
不相似的点在于:AE所用的训练方法是BP算法,其loss函数是距离函数,其输入层和最终的输出层是一样的,即维度一致。目的是为了使得输出和输入越来越相近。
RBM的隐藏层产生一个概率,其loss值是使得通过概率生成的新的数据与原始概率的分布误差越来越小。
其训练方法是CD-k,loss函数是能量函数。他的特征提取出来会更丰富。他只有两层,但AE可以有多层。

算法步骤:
1、归一化:彩色图变为灰度图,将人脸对齐,归一化到同一尺寸
2、先使用CMU Multi-PIE数据集做预训练,得到一个初始模型,之后输入图片素描对,对参数进行微调,得到更新后的模型,之后分别通过模型对图片和素描进行特征提取,将得到的图片和素描特征串联起来,输入到后面的神经网络分类器中,训练一个分类器。之后用该分类器求取测试集的matching score
提取特征的算法图:
在这里插入图片描述
整个算法步骤图示如下:
在这里插入图片描述
最终的实验结果如下:
在这里插入图片描述
补充:
svm分类器和神经网络分类器的区别:线性SVM分类器和神经网络分类器相似,但非线性SVM分类器和神经网络分类器相差较大,在此并不细说。
参考博客:
RBM
http://baijiahao.baidu.com/s?id=1599798281463567369&wfr=spider&for=pc
逐层贪婪预训练
https://blog.csdn.net/jningwei/article/details/78836823
深度置信网络
https://blog.csdn.net/kellyroslyn/article/details/82668733
https://blog.csdn.net/u013714645/article/details/74892888
AE
https://blog.csdn.net/zb123455445/article/details/78924074
AE和RBM的区别
https://blog.csdn.net/wtq1993/article/details/51510370

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值