ML-kNN 多标签k近邻算法 MLL Week 1

ML-kNN 多标签k近邻算法 MLL Week 1


  学习张敏灵老师的《ML-kNN: a lazy learning approach to multi-label learning》的学习笔记。

传统kNN


  k近邻算法(k-Nearest Neighbour, KNN)是机器学习中最基础,最简单的常用算法之一。其思想非常直接:如果一个样本在特征空间中的k个最相似(即特征空间中距离最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。
  如下图的 Xu ,它最近的邻居中属于 ω1 的最多,因此他被归类于 ω1 类。
这里写图片描述
  这个思想很容易理解,就是俗话中常说的“近朱者赤,近墨者黑”。在单标签学习中,与一个实例在特征空间中越相近(即距离越近)的实例,他们之间标签相同的可能性就越大。

多标签kNN


  而在多标签问题中,我们仍可根据这个思想推导出多标签学习的kNN算法,即ML-kNN算法。
  多标签kNN的主要思想是对于每一个新实例(instance),距离它最近的k个实例(特征空间中与它的距离最小的k个实例)可以首先得到,然后得到这些实例的标签集合,之后通过最大后验概率准则来确定新实例的标签集合。


这里给出算法的具体数学计算方法:

变量定义:
k 为取最近邻个数
Y 为所有标签的集合,总标签个数可以定义为 n
l 为一个标签, lY
x 为一个实例
Yx 为实例 x 对应的标签集合, YxY
y⃗ x x 的标记向量,是一个 1×n 的行向量,它的元素 y⃗ x(l) 若为1,代表 lYx ,若为0,则 lYx
N(x) 记录 x k 个最近邻的索引


然后,我们可以得到对应 k

  • 16
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值