KNN算法学习总结

原视频链接


一、Knn是什么?

寻找未知分类的数据,以离他最近的已知n个数据,来看他应该属于哪一类

如图,k值视为临近范围。
如果K=3,那么离绿色点最近的有2个红色三角形和1个蓝色的正方形,这3个点投票,于是绿色的这个待分类点属于红色的三角形。
如果K=5,那么离绿色点最近的有2个红色三角形和3个蓝色的正方形,这5个点投票,于是绿色的这个待分类点属于蓝色的正方形。可见K值的选择对分类的结果还是有很大的影响。

在这里插入图片描述
距离度量: sklearn knn的使用,以及cross validation交叉验证

二、应用步骤

1.准备一些数据csv文件(这里以癌症检测数据为例)
2.在pycharm引入csv包(即可读取又可输出)

代码如下:

import  csv

2.读入数据

代码如下:

with open('Prostate_Cancer.csv', 'r') as file:  # 打开csv文件并读取,需要先下载此
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值