人脸识别和神经风格迁移
4.1 人脸识别
4.1.1 人脸识别的一些术语
人脸验证:1对1问题
识别问题:1对k
4.1.2 One-shot learning(一次学习问题)
描述:通过一张图片识别对象
解决办法:Learning a“similarity"’ function:用函数d,输入两张图片,输出两张图片的差异值d,当小于某个阈值时证明是同一个人。
4.1.3 Siamese network
实现4.1.2的d函数
将两张图片运行相同的卷积网络,然后比较他们
描写d函数:可以判断是否是一个人
原理:
4.1.3.2 参考文献
[Taigman et.al.,2014. DeepFace closing the gap to human level performance]
4.1.4三元组损失函数(Triplet loss)
4.1.4.1 简介
看一个anchor(A)图片,positive(P)为同一人或者接近,negative(N)为不同的人,三元:同时要看三张图片
加入间隔参数α,拉大了两对图片的距离
4.1.4.2 公式化表示和定义
损失函数
选择较难的三元组
梯度下降训练三元组损失函数
4.1.4.3 参考文献
参考文献:[Schroff et al.,2015, FaceNet: A unified embedding for face recognition and clustering]
4.1.5 其他学习卷积神经网络参数的方法
4.1.5.1 二分类问题
其他代替绿部分的函数:x平方相似度
4.1.5.2 参考文献
[Taigman et.al.,2014.DeepFace closing the gap to human level performance]
4.2 神经风格迁移
4.2.1What is neural style transfer?
很神奇吧,两张图片的特征融合了
4.2.2 What are deep ConvNets learning?
第一层的9个神经单元:
4.2.2.1
神经网络隐藏单元的计算内容
接着放大
每加深一层,用于最大化激活函数的图片越清晰。从简单物体逐渐探测到复杂物体。
4.2.2.2 文献来源
[Zeiler and Fergus.,2013, Visualizing and understanding convolutional networks]
4.2.3 Cost Function(代价函数)
4.2.3.1 代价函数
- 定义一个关于G的代价函数 J(G),用来评判某个生成图像的好坏,然后使用梯度下降法去最小化 J(G),以便于生成图像
4.2.3.2 内容代价函数
具体理解: l 层不会太深也不会太浅
4.2.3.3 风格代价函数
找到相关系数
Intuition about style of an image
风格矩阵
- 参数
- 计算了k 和 k’ 所有参数之间的相关系数
- 对l层定义风格参数
对各层都使用风格代价函数:全体代价函数J(G)
4.2.3.4 文献来源
[Gatys et al.,2015.A neural algorithm of artistic style.Images on slide generated by Justin Johnson]——4.2.3.1
[Gatys et al.,2015.A neural algorithm of artistic style]——4.2.3.2 &4.2.3.3
4.3 一维到三维推广
4.3.1 Convolutions in 2D and 1D
一维数据用一维过滤器处理卷积
4.3.2 3D
3D数据,脑部CT
具有长宽高
3D卷积: