研究内容:
中文汉字识别是一项具有挑战性的任务,涉及到对中文字符的准确分类。在这个项目中,目标是构建一个能够准确识别中文汉字的系统。这个任务涉及到数据集的收集、预处理、模型训练和评估等步骤。尝试了使用残差神经网络(ResNet)、VGG和AlexNet等经典模型来解决中文汉字识别任务。这些模型都在图像识别领域取得了显著的成就,但各自具有不同的架构和特点。
研究成果:
成功构建了一个中文汉字识别系统,可以识别中文汉字。
借助QT实现了一个具有良好用户体验的前端界面,使得用户可以轻松地使用识别系统
主要内容:
项目分为三个文件:
运行process.py可以将data文件下的图片数据集保存成txt格式记录。
运行modeltrain.py可以读取txt记录的图片数据进行训练,训练的模型保存在本地,其中提供了10多种的模型可以任意的切换。包括:efficientnet、Alexnet、DenseNet、DLA、GoogleNet、Mobilenet、ResNet、ResNext、ShuffleNet、Swin_transformer、VGG等。训练结束后保存评价指标图在result文件下:
最后运行presentation.p