机器学习python实战——第二章k-近邻算法

最新推荐文章于 2024-07-20 10:44:41 发布

挂电的小瓜虫

最新推荐文章于 2024-07-20 10:44:41 发布

阅读量166

点赞数 1

分类专栏：机器学习python实战

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jia_shun_L/article/details/97948437

版权

机器学习python实战专栏收录该内容

2 篇文章 0 订阅

订阅专栏

k-近邻算法

针对多分类问题

三大要素：k值，距离度量，决策规则
k值：过大，过拟合；过小，欠拟合？？

距离度量：L-P函数

决策规则：多数表决

主函数：classify

输入：k值，待分类数据集，学习数据集，训练数据类别

输出：类别

思路：计算待分类数据与左右训练数据的距离，根据距离小的前k个的数据类别的多数决定该数据的类别

子函数：

（1）file2matrix：读取文件

输入：文件名

输出：数据以及类别

（2）majority：同决策树

（3）autonorm：数值归一化

输入：数据

输出：最小值，最小最大差值，归一化后的数据

思路：投影到零到壹，公式：（x-min）/（max-min）

案例：改进约会网站

测试：测试集的构造and误分率的计算

预测：互动式数据数据

案例：手写识别系统

img2vector：将32*32像素变为1024

deal：批量处理同一目录下的文件

挂电的小瓜虫

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习python实战——第二章k-近邻算法

k-近邻算法针对多分类问题三大要素：k值，距离度量，决策规则k值：过大，过拟合；过小，欠拟合？？距离度量：L-P函数决策规则：多数表决主函数：classify输入：k值，待分类数据集，学习数据集，训练数据类别输出：类别思路：计算待分类数据与左右训练数据的距离，根据距离小的前k个的数据类别的多数决定该数据的类别子函数：（1）file2matrix：读取文件输入：文件名输出：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。