机器学习第一周打卡:knn算法学习

用途:用来做分类或者做逻辑回归用
模型是由三个核心元素构成:
1、距离度量
2、K值
3、分类决策规则

整体算法流程:
1、计算测试集到训练集的各个数据点的距离,这里就可以用很多距离进行考核
2、对距离进行排序
3、选择K值,这个K值,是指距离测试集最近的训练集要选多少个
4、看选择K值后的几个训练值频次是怎么样的,然后把测试集的结果=频次最高的那个结果就完事儿了

其实挺简单,可以理解为:找距离我最近的几个样本,他们中大部分的样子就是我的样子
在这里插入图片描述
回答上面问题哈:
1、优点:简单已理解,可以给业务迅速讲清楚
缺点:如果测试集数据在训练集范围外部,就不好进行预测
2、在这里插入图片描述
可能存在距离相等,但是位置对称的情况,这样就选错范围了
3、如何选取K值
多测几遍,看预测值与真实值的误差,最终选取最小误差情况下的k值
4、时间复杂度o(n),高维数据进行降维。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值