文献阅读 - Distance Metric Learning for Large Margin Nearest Neighbor Classification

最新推荐文章于 2021-08-31 20:17:17 发布

K5niper

最新推荐文章于 2021-08-31 20:17:17 发布

阅读量3.6k

点赞数 6

分类专栏：文献阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaoyin214/article/details/89681364

版权

本文介绍了一种针对kNN分类器的度量学习方法，旨在通过优化马氏距离度量，确保同类样本间的距离最小，不同类样本间距离大于预设余量。这种大余量最近邻（LMNN）分类方法与支持向量机有相似之处，通过凸优化问题求解最佳线性变换。实验表明，学习到的距离度量能有效提升kNN的分类性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Distance Metric Learning for Large Margin Nearest Neighbor Classification

Weinberger K Q . Distance Metric Learning for Large Margin Nearest Neighbor Classification[J]. NIPS, 2005.

摘要

度量（metric）学习的目标是使得 $k$ 个最近邻样本总是属于同一类别，且不同类别样本之间的距离很大。

无需修改即可处理多分类（multiway）问题

1 引言

kNN分类器对未标记样本的分类规则为：训练集中与其最近的 $k$ 个样本投票表决，因此kNN分类器的性能取决于其采用的距离度量（distance metric）。

通常kNN分类器采用欧氏距离（Euclidean distance metric）衡量样本相似度，然而，欧氏距离完全不考虑训练集数据的统计特性。

相关文献指出：从标注样本中学习得到的距离度量，能够显著提高kNN的分类能力。

本文给出一种针对kNN分类器的马氏距离度量（Mahanalobis distance metric）学习方案，该度量的优化目标是 $k$ 个最近邻样本总是属于同一类别，且不同类别样本之间的距离不小于某一余量（large margin）。

大余量最近邻（large margin nearest neighbor，LMNN）分类

2 模型

训练集为 $\left\{\mathbf{x}_{i}, y_{i} \right\}_{i = 1}^{n}$ ，其中样本 $\mathbf{x}_{i} \in \mathcal{R}^{d}$ ，标签 $y_{i}$ 为离散类别；

二进制矩阵 $y_{ij} \in \{0, 1\}$ 表示标签 $y_{i}$ 和 $y_{j}$ 是否相同；

通过学习线性变换（linear transformation） $\mathbf{L}: \mathcal{R}^{d} \rightarrow \mathcal{R}^{d}$ ，并将其用于计算平方距离：

$\mathcal{D}(\mathbf{x}_{i}, \mathbf{x}_{j}) = \| \mathbf{L}(\mathbf{x}_{i}, \mathbf{x}_{j}) \|^{2} \tag{1}$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。