基于卷积神经网络的书法字体识别系统,resnet50,mobilenet模型【pytorch框架+python】

   更多目标检测和图像分类识别项目可看我主页其他文章

功能演示:

基于卷积神经网络的书法字体识别系统,resnet50,mobilenet【pytorch框架,python,tkinter】_哔哩哔哩_bilibili

(一)简介

基于卷积神经网络的书法字体识别系统是在pytorch框架下实现的,这是一个完整的项目,包括代码,数据集,训练好的模型权重,模型训练记录,ui界面和各种模型指标图表等。

该项目有两个可选模型:resnet50和mobilenet,两个模型都在项目中;GUI界面由tkinter设计和实现。此项目可在windowns、linux(ubuntu, centos)、mac系统下运行。

该项目是在pycharm和anaconda搭建的虚拟环境执行,pycharm和anaconda安装和配置可观看教程:

windows保姆级的pycharm+anaconda搭建python虚拟环境_windows启动python虚拟环境-CSDN博客

在Linux系统(Ubuntn, Centos)用pycharm+anaconda搭建python虚拟环境_linux pycharm-CSDN博客

(二)项目介绍

1. 项目结构

​​​​

该项目可以使用已经训练好的模型权重,也可以自己重新训练,自己训练也比较简单

以训练resnet50模型为例:

第一步:修改model_resnet50.py的数据集路径,模型名称、模型训练的轮数

​ 

第二步:模型训练和验证,即直接运行model_resnet50.py文件

第三步:使用模型,即运行gui_chinese.py文件即可通过GUI界面来展示模型效果

2. 数据结构

​​​​​

部分数据展示: 

​​​​

3.GUI界面(技术栈:tkinter+python) 

​​​​

4.模型训练和验证的一些指标及效果
​​​​​1)模型训练和验证的准确率曲线,损失曲线

​​​​​2)热力图

​​3)准确率、精确率、召回率、F1值

4)模型训练和验证记录

​​

(三)代码

由于篇幅有限,只展示核心代码

    def main(self, epochs):
        # 记录训练过程
        log_file_name = './results/resnet50训练和验证过程.txt'
        # 记录正常的 print 信息
        sys.stdout = Logger(log_file_name)
 
        print("using {} device.".format(self.device))
        # 开始训练,记录开始时间
        begin_time = time()
        # 加载数据
        train_loader, validate_loader, class_names, train_num, val_num = self.data_load()
        print("class_names: ", class_names)
        train_steps = len(train_loader)
        val_steps = len(validate_loader)
        # 加载模型
        model = self.model_load()  # 创建模型
        # 修改全连接层的输出维度
        in_channel = model.fc.in_features
        model.fc = nn.Linear(in_channel, len(class_names))
 
        # 模型结构可视化
        x = torch.randn(16, 3, 224, 224)  # 随机生成一个输入
        # 模型结构保存路径
        model_visual_path = 'results/resnet50_visual.onnx'
        # 将 pytorch 模型以 onnx 格式导出并保存
        torch.onnx.export(model, x, model_visual_path)  
        # netron.start(model_visual_path)  # 浏览器会自动打开网络结构
 
 
        # 将模型放入GPU中
        model.to(self.device)
        # 定义损失函数
        loss_function = nn.CrossEntropyLoss()
        # 定义优化器
        params = [p for p in model.parameters() if p.requires_grad]
        optimizer = optim.Adam(params=params, lr=0.0001)
 
        train_loss_history, train_acc_history = [], []
        test_loss_history, test_acc_history = [], []
        best_acc = 0.0
 
        for epoch in range(0, epochs):
            # 下面是模型训练
            model.train()
            running_loss = 0.0
            train_acc = 0.0
            train_bar = tqdm(train_loader, file=sys.stdout)
            # 进来一个batch的数据,计算一次梯度,更新一次网络
            for step, data in enumerate(train_bar):
                # 获取图像及对应的真实标签
                images, labels = data
                # 清空过往梯度
                optimizer.zero_grad()
                # 得到预测的标签
                outputs = model(images.to(self.device))
                # 计算损失
                train_loss = loss_function(outputs, labels.to(self.device))
                # 反向传播,计算当前梯度
                train_loss.backward()
                # 根据梯度更新网络参数
                optimizer.step()  
 
                # 累加损失
                running_loss += train_loss.item()
                # 每行最大值的索引
                predict_y = torch.max(outputs, dim=1)[1]  
                # torch.eq()进行逐元素的比较,若相同位置的两个元素相同,则返回True;若不同,返回False
                train_acc += torch.eq(predict_y, labels.to(self.device)).sum().item()
                # 更新进度条
                train_bar.desc = "train epoch[{}/{}] loss:{:.3f}".format(epoch + 1,
                                                                         epochs,
                                                                         train_loss)
            # 下面是模型验证
            # 不启用 BatchNormalization 和 Dropout,保证BN和dropout不发生变化
            model.eval()
            # accumulate accurate number / epoch
            val_acc = 0.0  
            testing_loss = 0.0
            # 张量的计算过程中无需计算梯度
            with torch.no_grad():  
                val_bar = tqdm(validate_loader, file=sys.stdout)
                for val_data in val_bar:
                    # 获取图像及对应的真实标签
                    val_images, val_labels = val_data
                    # 得到预测的标签
                    outputs = model(val_images.to(self.device))
                    # 计算损失
                    val_loss = loss_function(outputs, val_labels.to(self.device))  
                    testing_loss += val_loss.item()
                    # 每行最大值的索引
                    predict_y = torch.max(outputs, dim=1)[1]  
                    # torch.eq()进行逐元素的比较,若相同位置的两个元素相同,则返回True;若不同,返回False
                    val_acc += torch.eq(predict_y, val_labels.to(self.device)).sum().item()
 
            train_loss = running_loss / train_steps
            train_accurate = train_acc / train_num
            test_loss = testing_loss / val_steps
            val_accurate = val_acc / val_num
 
            train_loss_history.append(train_loss)
            train_acc_history.append(train_accurate)
            test_loss_history.append(test_loss)
            test_acc_history.append(val_accurate)
 
            print('[epoch %d] train_loss: %.3f  val_accuracy: %.3f' %
                  (epoch + 1, train_loss, val_accurate))
            # 保存最佳模型
            if val_accurate > best_acc:
                best_acc = val_accurate
                torch.save(model.state_dict(), self.model_name)
 
        # 记录结束时间
        end_time = time()
        run_time = end_time - begin_time
        print('该循环程序运行时间:', run_time, "s")
        # 绘制模型训练过程图
        self.show_loss_acc(train_loss_history, train_acc_history,
                           test_loss_history, test_acc_history)
        # 画热力图
        test_real_labels, test_pre_labels = self.heatmaps(model, validate_loader, class_names)
        # 计算混淆矩阵
        self.calculate_confusion_matrix(test_real_labels, test_pre_labels, class_names)

​​​​​(四)总结

以上即为整个项目的介绍,整个项目主要包括以下内容:完整的程序代码文件、训练好的模型、数据集、UI界面和各种模型指标图表等。

项目运行过程如出现问题,请及时交流!

### 回答1: 卷积神经网络CNN)是一种深度学习算法,通常用于解决计算机视觉问题。在人脸识别领域,CNN非常适合提取人脸图像的特征,因为它可以自动学习并提取最有意义的特征。 PyTorch是一种基于Python的深度学习框架,可以帮助开发人员快速设计、构建和训练深度学习模型。在人脸识别领域,PyTorch已被广泛使用。 基于卷积神经网络的人脸识别模型通常由卷积层、池化层、全连接层和分类器组成。 卷积层主要用于提取人脸图像的特征,而池化层则用于减少模型的参数数量和计算量。 全连接层是用于该模型的分类器,通常用于将卷积层和池化层中提取的特征将其转换为可供分类器识别的形式。 在使用PyTorch进行人脸识别时,通常需要遵循以下步骤: 1. 收集和准备人脸数据集。 2. 构建卷积神经网络。 3. 通过将数据集分割成训练集和测试集来训练模型。 4. 评估模型的准确性以及确定任何需要进行调整的部分。 5. 使用模型进行实际的人脸识别任务。 基于卷积神经网络的人脸识别模型具有许多优势,包括高准确度、高效、可伸缩性和应用范围广,已经被广泛应用于面部识别,安全和监控系统等领域。 ### 回答2: 基于卷积神经网络的人脸识别是目前人工智能领域的热门应用之一,其中pytorch是当前广泛应用于该领域的深度学习框架之一。卷积神经网络是一种特殊类型的神经网络,具有良好的特征提取和分类能力,适合用于人脸识别领域。 在pytorch中,可以通过搭建卷积神经网络来进行人脸识别。首先,需要准备一组训练数据集和测试数据集,可以采用公开的人脸数据集,如LFW数据集。接着,可以使用pytorch的卷积层、池化层、全连接层等组件搭建卷积神经网络模型,可以采用经典的卷积神经网络结构,如AlexNet、VGG或ResNet等。 然后,需要对训练数据集进行数据增强、归一化等预处理操作,并使用损失函数来进行模型的训练和优化。同时,为了避免过拟合,可以采用一些正则化方法,如dropout、L1/L2正则化等。 最后,在测试阶段,可以将测试数据集输入训练好的人脸识别模型中,通过计算模型的预测结果(如softmax概率分布)来进行人脸识别判别。 总的来说,基于卷积神经网络的人脸识别pytorch实现较为简单易懂,具有很高的精度和效率,有着广泛的应用前景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值