KNN算法学习总结

最新推荐文章于 2023-10-09 21:32:54 发布

IOT hzj

最新推荐文章于 2023-10-09 21:32:54 发布

阅读量1.1k

点赞数 1

分类专栏：新手文章标签：算法 python 机器学习

本文链接：https://blog.csdn.net/huangzhijie29/article/details/119900036

版权

原视频链接

文章目录

一、Knn是什么？
- - - 寻找未知分类的数据，以离他最近的已知n个数据，来看他应该属于哪一类
二、应用步骤
测试结果

一、Knn是什么？

寻找未知分类的数据，以离他最近的已知n个数据，来看他应该属于哪一类

如图，k值视为临近范围。
如果K=3，那么离绿色点最近的有2个红色三角形和1个蓝色的正方形，这3个点投票，于是绿色的这个待分类点属于红色的三角形。
如果K=5，那么离绿色点最近的有2个红色三角形和3个蓝色的正方形，这5个点投票，于是绿色的这个待分类点属于蓝色的正方形。可见K值的选择对分类的结果还是有很大的影响。

在这里插入图片描述
距离度量： sklearn knn的使用，以及cross validation交叉验证

二、应用步骤

1.准备一些数据csv文件（这里以癌症检测数据为例）

2.在pycharm引入csv包（即可读取又可输出）

代码如下：

import  csv

2.读入数据

代码如下：

with open('Prostate_Cancer.csv', 'r') as file:  # 打开csv文件并读取，需要先下载此文件
    reader = csv.DictReader(file)  # DictReader可以以字典的方式读取文件

    datas = [row for row in reader]  # 循环读取数据

3.打乱数据集并分段数据作为训练和测试类

random.shuffle(datas)  # 引用random包，随机打乱数据集，使每次训练的顺序不同达到训练目的
n = len(datas)//3  #

最低0.47元/天解锁文章

IOT hzj

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
KNN算法学习总结

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码
复制链接

扫一扫