mnnhjjsdfs-CSDN博客

原创 088基于深度学习的番茄病害检测小程序版本

在02中可以选择的模型有10多种可以对比，包括alexnet、DenseNet、DLA、GoogleNet、Mobilenet、ResNet、ResNeXt、ShuffleNet、VGG、EfficientNet和Swin transformer等10多种模型。运行03flask_server.py是使用flask生成http接口连接小程序端，通过小程序传过来的图片，调用logs文件夹下训练好的模型，识别结果返回给小程序端口。运行02train.py可以对txt文本中的图片路径读取并训练模型，

2024-02-18 04:47:29 483

原创 089基于深度学习的小样本数据检测

在02中可以选择的模型有10多种，可以都训练进行对比、包括alexnet、DenseNet、DLA、GoogleNet、Mobilenet、ResNet、ResNeXt、ShuffleNet、VGG、EfficientNet和Swin transformer等10多种模型。运行01数据集文本生成制作.py可以读取图片，先进行数据增强之后，保存图片在data2文件夹下，在将每张图路径保存再txt文本中，运行02train.py可以对txt文本中的图片路径读取并训练模型，每个类别只有10张图片数据，

2024-02-18 04:46:19 373

原创 090基于深度学习的车辆速度检测

运行04ui_pyqt5.py可以加载pyqt界面，通过点击按钮加载自己需要检测的车辆视频文件，然后识别视频中的车辆速度。运行03detector_photo.py可以对单张图片进行检测并识别，运行02train.py会训练模型保存在runs文件夹下，运行01makeTxt.py可以生成数据集txt文本，

2024-02-18 04:45:15 386

原创 091基于深度学习的手写汉字数字识别含10多种模型

在02中可以选择的模型有10多种，可以都训练进行对比、包括alexnet、DenseNet、DLA、GoogleNet、Mobilenet、ResNet、ResNeXt、ShuffleNet、VGG、EfficientNet和Swin transformer等10多种模型。运行03文字识别界面程序.py可以生成一个可视化的界面，通过点击按钮加载图片识别。运行01数据集文本生成制作.py可以读取图片路径保存再txt文本中，运行02train.py可以对txt文本中的图片路径读取并训练模型，

2024-02-18 04:41:56 420

原创 093自动生成xml目标检测框数据集-不用手动标注

这个是通过轮廓查找，自动将检测的到的轮廓外接矩形保存成xml文件，可以供目标检测数据集训练使用。首先打开02auto_xml.py文件，将里面第71行的阈值修改成上面获取得到的最合适的阈值，该生成的xml文件可以用labelimg打开检查生成效果，可用于目标检测数据集训练模型。就会将jpg文件夹里面的所有图片都进行轮廓查找，将外接矩形框保存成xml文件。回到代码部分，整个代码分为两个部分，（一个文件夹存放图片和两个py代码文件），弹出可视化界面，然后我们加载需要处理的图片，再选择合适的轮廓查找阈值。

2024-02-18 04:39:42 335

原创 094模版匹配自动标注xml文件

再点击第三个按钮Detect and Save，将会将刚刚的模版小图对全图进行匹配，看全图中有多少可以匹配这个小图的，满足匹配的都会框选出来。，弹出可视化界面，然后我们点击Load Image按钮，加载需要处理的图片文件夹，他会将图片按顺序加载进来。这个是通过模版匹配查找，自动将检测的到的匹配矩形保存成xml文件，可以供目标检测数据集训练使用。并且在图片文件夹中保存xml文件，里面记录了刚刚框选的坐标信息。命令行输入 python 01main.py。通过自动标注可以节省自己大量的时间和精力。

2024-02-18 04:38:32 326

原创 095行为得分预测-写作行为判断得分

然后再运行python 02predict.py可以调用这个训练好的模型进行写作行为预测，在可视化的界面上，我们输入写作的敲击字符个数和写作时长即可得到预测最后的写作得分。，首先我们看到data文件中的csv文件部分，数据包含word敲击的单词字符个数，和time敲击时所消耗的时间，已经写着得分score，得分最低0.5分，最高6分。该代码是通过训练数据，得到写作行为预测模型，然后可以在可视化的界面上输入参数，预测写作得分。代码包括数据集在data文件下，是csv格式，和两个py文件。

2024-02-18 04:37:35 338

原创 096cifar10基于卷积神经网络的识别

代码主要包含data存放cifar10数据集部分，logs文件夹存放生成的txt文本和训练得到的模型。03pyqt是进行可视化界面的图片预测。训练得到的模型保存在logs文件下，然后我们运行python 03pyqt.py可生成可视化的界面，加载训练好的模型，对输入的图片进行预测。txt里面每一行表示的是图片路径和对应的标签序号。我们先看到数据集部分，每个类别下有5000张图，共计10个类别5w张图片，每个图片尺寸为32成32的彩图。通过训练cifar10的五w张数据图，得到的模型进行识别检测。

2024-02-18 04:36:11 355

原创 097cifar100基于卷积神经网络的识别

运行python 01数据集文本生成制作.py 可以生成txt文本保存在logs文件下，里面存在图片路径和对应标签。运行python 02train.py会对data文件里面图片进行提取训练模型，得到的模型也保存在logs文件里。数据集包含100个类别，每个类别各500张图片，合集5w张和上一期的cifar10数据集图片个数一致。运行03pyqt.py可以展示可视化的界面，加载图片调用模型识别结果。cifar100数据集进行训练，得到的模型在可视化的界面上识别。感兴趣的小伙伴可以进行下载。

2024-02-18 04:35:18 371

原创 098基于深度学习的语音识别

这是运行python 03pyqt.py的可视化界面，通过第一个按钮加载需要检测的音频，运行第三个按钮就会将检测结果，比如cat显示在下方Result处。运行python 02train.py就会训练这个txt文本里面的数据，并将训练的模型与验证集里面的数据进行验证。以下是训练过程的展示。运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了wav音频的路径和对应的标签。最后运行python 03pyqt.py即可加载训练好的模型，对输入的音频进行识别。

2024-02-18 04:34:23 360

原创 099基于深度学习的动物声音分类

这是运行python 03pyqt.py的可视化界面，通过第一个按钮加载需要检测的音频，运行第三个按钮就会将检测结果，比如cat显示在下方Result处。运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了wav音频的路径和对应的标签。运行python 02train.py就会训练这个txt文本里面的数据，并将训练的模型与验证集里面的数据进行验证。最后运行python 03pyqt.py即可加载训练好的模型，对输入的音频进行识别。

2024-02-18 04:33:20 360

原创 100基于卷积神经网络之鸟鸣识别鸟的种类

这是运行python 03pyqt.py的可视化界面，通过第一个按钮加载需要检测的音频，运行第三个按钮就会将检测结果，比如加载Bewicks_Wren这种鸟的wav音频就能对检测结果显示在下方Result处。运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了wav音频的路径和对应的标签。运行python 02train.py就会训练这个txt文本里面的数据，并将训练的模型与验证集里面的数据进行验证。有兴趣的小伙伴也可以自行扩充数据集，或训练自己的数据集。

2024-02-18 04:32:08 450

原创 101基于CNN的music音乐类别识别

这是运行python 03pyqt.py的可视化界面，通过第一个按钮加载需要检测的music音频，运行第三个按钮就会将检测结果，比如加载jazz这个环境声音的音频,就能对检测结果显示在下方Result处。运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了wav音频的路径和对应的标签。运行python 02train.py就会训练这个txt文本里面的数据，并将训练的模型与验证集里面的数据进行验证。有兴趣的小伙伴也可以自行扩充数据集，或训练自己的数据集。

2024-02-18 04:30:45 407

原创 102基于CNN识别50种环境声音

这是运行python 03pyqt.py的可视化界面，通过第一个按钮加载需要检测的音频，运行第三个按钮就会将检测结果，比如加载风这个环境声音的音频,就能对检测结果显示在下方Result处。运行python 02train.py就会训练这个txt文本里面的数据，并将训练的模型与验证集里面的数据进行验证。代码整体是非常简便的，总共三个py部分和一个数据集在data文件夹下。运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了wav音频的路径和对应的标签。

2024-02-18 04:28:49 424

原创 103基于深度学习的说话情感识别

这是运行python 03pyqt.py的可视化界面，通过第一个按钮加载需要检查的说话情感的音频，运行第三个按钮就会将检测结果，比如加载anger（生气）这个声音的音频,就能对检测结果显示在下方Result处。运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了wav音频的路径和对应的标签。运行python 02train.py就会训练这个txt文本里面的数据，并将训练的模型与验证集里面的数据进行验证。有兴趣的小伙伴也可以自行扩充数据集，或训练自己的数据集。

2024-02-16 16:54:34 421

原创 104基于深度学习识别是AI生成还是真实图片

运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了图片路径和对应的标签。然后运行python 02train.py就会训练这个txt文本里面的数据，并将训练好的模型也保存在本地。这是运行python 03pyqt.py的可视化界面，通过点击左侧可以加载要识别的检测对象图片，点击中间的识别按钮，会识别出结果，识别结果在右侧显示，当前识别的图片是真实的图片，非假图片。代码整体是非常简便的，总共三个py部分和一个数据集在data文件夹下。

2024-02-16 16:53:41 459

原创 105基于深度学习的手势方向识别含10多种模型

这是运行python 03pyqt.py的可视化界面，点击下方的打开摄像头/拍照按钮，就可以将画面定格，然后再点击上方的识别按钮就可以将识别结果展示在右侧。运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了图片路径和对应的标签。运行python 02train.py就会训练这个txt文本里面的数据，并将训练的模型与验证集里面的数据进行验证。最后运行python 03pyqt.py即可加载训练好的模型，对摄像头捕捉到的手势进行识别了。

2024-02-16 16:52:50 400

原创 106python语言含lenet5等多种卷积神经网络识别中文汉字

运行python 02train.py就会训练这个txt文本里面的数据，并将训练的模型与验证集里面的数据进行验证。这是运行python 03pyqt.py的可视化界面，通过在可视化的pyqt界面画板上画出我们需要识别的汉字，然后点击识别，就会在下方识别出结果。运行python 01数据集文本生成制作.py 会在logs文件夹下生成2个txt文本，分别存放了汉字数据集图片的路径和对应的标签。最后运行python 03pyqt.py即可加载训练好的模型，对画板上面的汉字进行识别。

2024-02-16 16:51:51 320

原创 107通过SVM+SIFT实现墙体裂缝检测

这是运行python 03pyqt.py的可视化界面，通过在可视化的pyqt界面加载我们需要检测的图片，再点击Analyze按钮就会识别结果在下方显示，识别是否含有裂缝。运行01train_SVM_SIFT.py 会将data文件夹下的4000张数据集进行特征提取。最后运行python 03pyqt.py即可加载训练好的模型识别界面上显示的图片结果。代码整体是非常简便的，总共三个py部分和一个数据集在data文件夹下。运行02predict.py会调用训练好的模型进行单张图片的识别。

2024-02-16 16:50:55 392

原创 108含resnet等多个模型的手写整句或单个中文汉字识别

同时提供了除resnet外，还有多种卷积神经网络供任意切换，包括VGG，Swin transformer,ShuffleNet,ResNeXt,Mobilenet,GoogleNet,DLA,DenseNet,AlexNet等等。这是运行python 03pyqt.py的可视化界面，通过在画板上用鼠标写出中文汉字，再点识别按钮就会识别结果在下方显示。运行01数据集文本生成制作.py 会将data文件夹下的手写汉字图片数据集保存txt格式，里面记录了图片路径和对应的标签。

2024-02-16 16:50:04 340

原创 109含ShuffleNet等多个模型的手写中文汉字识别摄像头版

同时提供了除ShuffleNet外，还有多种卷积神经网络供任意切换，包括VGG，Swin transformer,resnet,ResNeXt,Mobilenet,GoogleNet,DLA,DenseNet,AlexNet等等。运行01数据集文本生成制作.py 会将data文件夹下的手写汉字图片数据集保存txt格式，里面记录了图片路径和对应的标签。这是运行python 03pyqt.py的可视化界面，通过打开摄像头然后点击识别，就会识别当前帧的汉字是什么。训练好的模型同样保存在logs文件夹下。

2024-02-16 16:49:07 376

原创 110基于HWDB数据集识别多行文字含Mobilenet等多个模型

同时提供了除Mobilenet外，还有多种卷积神经网络供任意切换，包括VGG，Swin transformer,resnet,ResNeXt,Shufflenet,GoogleNet,DLA,DenseNet,AlexNet等等。运行01数据集文本生成制作.py 会将data文件夹下的HWDB图片数据集保存txt格式，里面记录了图片路径和对应的标签。这是运行python 03pyqt.py的可视化界面，通过加载本地的图片，会将图片中的汉字检测出来。同时生成评价指标图，f1-score,精确度和召回率。

2024-02-16 16:47:53 360

mnnhjjsdfs的博客