kNN分类器的甲骨文识别尝试

最新推荐文章于 2024-04-18 17:01:21 发布

Victor_zero

最新推荐文章于 2024-04-18 17:01:21 发布

阅读量4.3k

点赞数 2

分类专栏：机器学习文章标签：机器学习 kNN分类器文字识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Victor_zero/article/details/80329635

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

使用kNN分类器识别了给定的手写字数据集合，大概给定的数据集比较理想化或者手写字本身干扰不大，使得手写数字的正确率可以高达95.92%（虽然有些地方手写数字正确率可以高达100%，但是毕竟模型不同，样本也不同，这是在我第一次学过kNN分类器并优化数据样本集后达到的最高正确率）。

于是则萌生想要将模型应用到具体识别事件中，最终选择了比较类似手写字的甲骨文文字识别，一共296张样本，训练集为221，测试集为75，正确判断22，正确率为29.33%（k取值为3，如若更大则正确率更低）。效果不甚理想，正确率连50%都达不到，分析有以下原因：

1> 训练集、测试集数据太少，导致特征提取样本不够，进而使得特征判断精准度下降

2> 训练集及测试集图片污点、残缺、干扰太大，影响特征提取判断

3> 训练集方向单一，测试集文字若方向不同则导致特征判断失败

根据原因进行优化，前两条由于数据的限制无法找到有效解决方案，则对最后一条进行了解决，对每一张训练集样本顺时针分别旋转90， 180， 270度使得训练样本集扩充至1184张，间接解决了一部分第一条原因，然而最终结果仍是29.33%。遂认为图片的噪声影响对kNN分类器的特征提取即分类判断具有极大影响，在实际现实世界中，kNN分类器的限制极大，但对于具有高质量高特征的图片样本来说，kNN的简单及高泛化能力还是使得其具有很大价值。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
kNN分类器的甲骨文识别尝试

使用kNN分类器识别了给定的手写字数据集合，大概给定的数据集比较理想化或者手写字本身干扰不大，使得手写数字的正确率可以高达95.92%（虽然有些地方手写数字正确率可以高达100%，但是毕竟模型不同，样本也不同，这是在我第一次学过kNN分类器并优化数据样本集后达到的最高正确率）。（k取值为3，如若更大则正确率更低）于是则萌生想要将模型应用到具体识别事件中，最终选择了比较类似手写字的...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。