摘要: 度量学习的基本思想是将数据映射到一个新空间, 使得同一类别的数据更相近, 不同类别的数据更容易区分.
关于度量学习的发展史及更多资源见: https://blog.csdn.net/gdengden/article/details/82715162
https://blog.csdn.net/nehemiah_li/article/details/44230053
1. 几个特例
举几个我自己认为的特例.
1.1 PCA
主成分分析 (Pricipal Components Analysis, PCA) 是将原始空间线性地映射到一个低维的空间, 并尽可能保持对象距离的有序性, 即
d
(
x
i
,
x
j
)
>
d
(
x
i
,
x
k
)
⇒
d
′
(
x
i
,
x
j
)
>
d
′
(
x
i
,
x
k
)
d(x_i, x_j) > d(x_i, x_k) \Rightarrow d'(x_i, x_j) > d'(x_i, x_k)
d(xi,xj)>d(xi,xk)⇒d′(xi,xj)>d′(xi,xk), 其中
d
d
d 和
d
′
d'
d′ 分别是在原空间与新空间的距离度量,
x
i
x_i
xi 表示对象, 但并非相应的向量.
缺点: PCA 是一种无监督的方法, 它致力于在降维后依然保持数据的一致性, 而不是改变数据的内聚性与可分性.
1.2 BP 神经网络
对于一个
c
c
c 类的数据, 使用一个具有
c
c
c 个输出端口的神经网络进行训练. 可以将该网络作为度量学习器, 它将维度为
m
m
m 原空间映射到维度为
c
c
c 的新空间. 在这个新空间使用欧氏距离、Manhattan 距离都行.
缺点: 神经网络把活已经干完了, 与其说是度量学习, 不如说已经完成了分类.
2. 基本应用
结构化数据的分类: 使同类的更近, 不同类的更远.
非结构化数据 (图像、时序) 的分类: 将不同大小的数据映射到同一空间.
具体招数只有从相应论文中学习. 接来来我学习几篇写贴子.