戏说K近邻算法

俗话说得好,物以类聚,人以群分。K近邻算法的思想与此相近,通过对多个特征的相似程度进行量化来分类。

举个例子,钻石老王最近想找个伴儿,于是发布征婚启事,要求如下:
(1)年龄相近
(2)学历相近
(3)志趣相投(例如爱读书)
……
由于钻石老王有钱有颜,各方面条件都很优秀,备受欢迎,立刻有上百位女士回应他。问题来啦,如何准确筛选出最合适的soul mate?

头疼的钻石老王于是又发布了悬赏提问,奖金十万美元,问题非常凡尔赛,即如何在上百位相亲者中找到最合适自己的人?搞机器学习的小A找上门来,对他说,这个问题好办,咱们用K近邻算法来解决,做份调查问卷就行,并给出了以下建议:
(1)将老王最关注的信息列成清单,比如年龄、身高、学历等等;
(2)将老王对最关注信息的期望值写下来,比如身高165cm等;
(3)量化过程:设置上下限(比如不考虑小学学历),量化偏差(比如学历偏低则得分降一档)等;
(4)将上述内容整理成一份调查问卷,注意表达方式,避免获得过多的不真实信息。
(5)回收调查问卷,用K近邻算法计算各种信息(特征)与期望值的差值(选取合适的距离函数),差值最小的大概率就是钻石老王的soul mate。比分不相上下的,选个最顺眼的(投票表决)即可。

最终,钻石老王找到了他的soul mate, 小A拿到了十万美元奖金,真是个圆满的结局啊~ K近邻算法的核心思想,你学会了吗?

缺点主要是计算量大,一般适用于样本量较小的情况。

优点是准确率高,可适用的数据范围广,甭管是身高还是体重,都可以进行量化和用来判断。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值