python数据分析常用的算法_萌新向Python数据分析及数据挖掘 第三章 机器学习常用算法 第一节 KNN算法 (上)理解篇...

理解

用一个实际生活的例子来解释

假设你面前有一堆男人

分类问题:

这些男人的基本信息全部掌握,有一些是渣男,有一些是好男人,有一些是正常人

现在新来了几个男人,基本信息全部掌握,没有标注男人类型,需要从已知的男人作为参考,判断新来的男人的类型

KNN的思想就是:对每一个新来的男人,找出和他基本信息最相近的K个男人,看看他们这几个接近的男人的类型,然后以最多的类型作为预测

回归问题:

这些男人的基本信息全部掌握,包括他们的年收入

现在新来了几个男人,基本信息全部掌握,不包括年收入

KNN的思想就是:对每一个新来的男人,找出和他基本信息最相近的K个男人,看看他们这几个接近的男人的年收入,然后以平均数或加权平均数作为预测

训练测试分离

在给新来的男人预测时,先把原有的男人打乱顺序,随机抽取一定比例作为练习,看看自己看男人的眼光是否准确,再来对付新来的男人

超参数

k

选几个最相近的男人作为参考

权重

对于挑出来参考的这几个男人 更着重参考最接近的

p

评价最相近时使用闵科夫斯基距离的次方数

1310149-20190418154740524-36150200.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值