11.7KNN

最新推荐文章于 2021-10-29 09:25:53 发布

小帅的私人空间

最新推荐文章于 2021-10-29 09:25:53 发布

阅读量162

点赞数

分类专栏： python 机器学习文章标签： python机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/joshuajinxiaoshuai/article/details/78474357

版权

机器学习同时被 2 个专栏收录

33 篇文章 0 订阅

订阅专栏

24 篇文章 0 订阅

订阅专栏

跟着machine learn in action在重复造KNN轮子。有用sklearn实现KNN，还是人家的轮子好用。

还学了：
- numpy的矩阵用法http://mp.weixin.qq.com/s/FVI3zEp4it-fd99-3MU9vA
- Readlines, read, realine等等区别，
- 懂原理和写轮子还是很不一样的，工程能力弱鸡一个
- sklearn划分sklearn.model_selection.train_test_split和sklearn.cross_validation模块
- 一个完整过程：normalize数据，划分数据集，train，test accuracy(没用ROC因为其仅用于二分方法），K-fold cross validation,

KNN优缺点：

优点

简单好用，容易理解，精度高，理论成熟，既可以用来做分类也可以用来做回归；
可用于数值型数据和离散型数据；
训练时间复杂度为O(n)；无数据输入假定；
对异常值不敏感。

缺点：

计算复杂性高；空间复杂性高；
样本不平衡问题（即有些类别的样本数量很多，而其它样本的数量很少）；
一般数值很大的时候不用这个，计算量太大。但是单个样本又不能太少，否则容易发生误分。
最大的缺点是无法给出数据的内在含义。

和油管上面周莫烦联系tensorflow,为课程project准备。https://morvanzhou.github.io/

致谢：
http://blog.csdn.net/scut_arucee/article/details/50070765
http://blog.csdn.net/SCUT_Arucee/article/details/50261739
http://blog.csdn.net/Quincuntial/article/details/71104611
http://blog.csdn.net/u013710265/article/details/72722856

小帅的私人空间

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
11.7KNN

跟着machine learn in action在重复造KNN轮子。有用sklearn实现KNN，还是人家的轮子好用。还学了： - numpy的矩阵用法http://mp.weixin.qq.com/s/FVI3zEp4it-fd99-3MU9vA - Readlines, read, realine等等区别， - 懂原理和写轮子还是很不一样的，工程能力弱鸡一个 - sklearn划分sk
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。