TIP2018的
right @IEEE TRANSACTIONS ON IMAGE PROCESSING, VOL. 27, NO. 2, FEBRUARY 2018
吸引我的是其中应用的metric learning。我一直以为,metric learning其实和传统的dense prediction以及各种CNN背后的东西是一致的。你现在有这些东西,比方说一堆图片,那么机器怎么看待它们之间的差异?一种度量方式就创建了一个非欧空间,在什么样的理想空间,能够让机器的识别率爆表。很有意思。不过现有的度量学习本质上来讲是给维度加权,能量集中以及去噪。没达到理想的程度。
我花在abstract上的时间越来越多了,因为我发现,论文读到一半,可以回头看看abstract,佐证一下自己的思路。还有预见性,总之,一个好论文的abstract是作者思路的结晶,值得多读几遍。
1 abstract
本论文研究的领域是人脸再识别 ,比方说苹果手机的解锁,就是再识别你的脸。你要是画个大浓妆,指不定还能不能解锁。画个角度,换个表情,都会影响你的解锁(再识别)。
characteristic
- logistic discriminant metric learning
- exploit both original and auxiliary data(privileged information)
- auxiliary information only avaliable in training(such as label in cnn)
目标:
学习到距离函数,例如输入两个feature告诉你多远。打个比方二维空间(0,0),(3,4)之间的度量函数就是二范数,于是结果就是5.
距离函数的学习:
利用privilege information建立locally adaptive decision rule
现在不妨设origin数据分布在某个距离度量空间,privilege在另一个距离度量空间,那你现在就有两个距离度量方式,因为你有两个空间。这也包括了origin以及privilege都用通一种度量方式,在同一个空间。
样本点 O1,O2是origin的数据,P1,P2是privilege的数据。
DO(O1,O2) 与DP(P1,P2)之间的差距小。
(0,0),(3,4)分