使用KNN对MNIST数据集进行实验

最新推荐文章于 2024-09-17 15:14:03 发布

arthur503

最新推荐文章于 2024-09-17 15:14:03 发布

阅读量5.8k

点赞数

文章标签：机器学习 KNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/arthur503/article/details/21338483

版权

本文介绍了使用KNN算法对MNIST数据集进行分类实验的过程。未优化的KNN在未经尺度变换的数据上达到95%的正确率，而经过尺度变换后，正确率仍为96.687%，表明对于MNIST数据集，KNN的性能不受数据归一化影响。实验结果显示，KNN在这个任务上的表现优于预期。

摘要由CSDN通过智能技术生成

之前使用SVM对MNIST数据集进行了分类实验，得到了98.46%的分类正确率（见：使用libsvm对MNIST数据集进行实验）。

今天用python写了个小程序，来测试一下KNN的分类效果。

由于KNN的计算量太大，还没有使用KD-tree进行优化，所以对于60000训练集，10000测试集的数据计算比较慢。这里只是想测试观察一下KNN的效果而已，不调参。

K选择之前看过貌似最好不要超过20，因此，此处选择了K=10，距离为欧式距离。如果需要改进，可以再调整K来选择最好的成绩。

先跑了一遍不经过scale的，也就是直接使用像素灰度值来计算欧式距离进行比较。发现开始基本稳定在95%的正确率上，吓了一跳。因为本来觉得KNN算是没有怎么“学习”的机器学习算法了，猜测它的特点可能会是在任何情况下都可以用，但都表现的不是最好。所以估计在60%～80%都可以接受。没想到能基本稳定在95%上，确定算法和代码没什么问题后，突然觉得是不是这个数据集比较没挑战性。。。

去MNIST官网（http://yann.lecun.com/exdb/mnist/），上面挂了以该数据集为数据的算法的结果比较。查看了一下KNN，发现有好多，而且错误率基本都在5%以内，甚至能做到1%以内。唔。

跑的结果是，正确率：96.687%。也就是说，错误率error rate为3.31%左右。

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。