091手写汉字识别含多个模型识别

最新推荐文章于 2024-04-14 15:14:49 发布

HDFGKJSDHFLS

最新推荐文章于 2024-04-14 15:14:49 发布

阅读量585

点赞数 1

分类专栏：深度学习文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HDFGKJSDHFLS/article/details/133654145

版权

深度学习专栏收录该内容

2 篇文章

订阅专栏

基于CNN（卷积神经网络）的汉字识别是一种基于图像处理和深度学习技术的应用。CNN是目前应用最广泛且效果最好的一种深度学习网络结构之一，其具有自动提取特征、良好的适应性和较高的识别准确率等优点。

常用的CNN网络结构包括：

LeNet-5：是最早采用卷积神经网络架构进行手写数字识别的模型之一，由两个卷积层和三个全连接层组成。
AlexNet：是2012年在ImageNet Large Scale Visual Recognition Challenge上获胜的模型，由5个卷积层和3个全连接层组成。
VGG：VGG系列模型在2014年ILSVRC竞赛中获得了优异成绩，其特点是采用非常小的卷积核大小(3x3)，但却有很深的网络结构，例如VGG16和VGG19。
GoogleNet：也叫Inception-v1，是Google团队在2014年的ILSVRC竞赛中提出的一种模型。其核心思想是采用inception模块来提高其在不同尺度下的特征表达能力。
ResNet：ResNet是2015年ImageNet竞赛的冠军模型，其创新之处在于提出了残差学习，即通过将输入和输出相加来跨越层之间直接的信息流障碍。

当然，还有很多其他的CNN网络结构，例如MobileNet、ShuffleNet等。在汉字识别领域，可以根据具体的应用场景和数据集情况选择适合的模型结构。

demo仓库和视频演示找091期：

到此一游7758258的个人空间_哔哩哔哩_bilibili

效果展示图如下：

代码文件展示如下：

运行01数据集文本生成制作.py可以读取图片路径保存再txt文本中，

运行02train.py可以对txt文本中的图片路径读取并训练模型，

在02中可以选择的模型有10多种，可以都训练进行对比、包括alexnet、DenseNet、DLA、GoogleNet、Mobilenet、ResNet、ResNeXt、ShuffleNet、VGG、EfficientNet和Swin transformer等10多种模型。

训练的每个epoch都会显示准确率precision、召回率recall和 f1-score

训练完成后评价指标图会保存在result文件夹下。

运行03文字识别界面程序.py可以生成一个可视化的界面，通过点击按钮加载图片识别。

博客等级

码龄2年

2
原创

2
点赞

7
收藏

0
粉丝

关注

私信

热门文章

分类专栏

深度学习 2篇

最新评论

091手写汉字识别含多个模型识别
CSDN-Ada助手: 非常棒的博客！你对不同的模型进行了详细的介绍和比较，这对于读者来说非常有帮助。希望你可以继续分享关于汉字识别的知识和经验。另外，除了模型选择，你还可以考虑深入探讨数据预处理、特征提取和模型调参等方面的内容，这些都是提高识别准确率的重要因素。期待你未来的文章能够更全面地覆盖这些内容，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

079含10多种卷积神经网络CNN模型的图像识别小程序版本

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。