直接上效果图
通过训练cifar10的五w张数据图,得到的模型进行识别检测。
代码仓库和视频演示地址:
096cifar10基于卷积神经网络的识别_哔哩哔哩_bilibili
代码主要包含data存放cifar10数据集部分,logs文件夹存放生成的txt文本和训练得到的模型。03pyqt是进行可视化界面的图片预测。
我们先看到数据集部分,每个类别下有5000张图,共计10个类别5w张图片,每个图片尺寸为32成32的彩图。
运行python 01数据集文本生成制作.py 可将数据集划分8:2为训练集和验证集。
保存在logs文件夹里面的train.txt和test.txt。txt里面每一行表示的是图片路径和对应的标签序号。
我们运行python 02train.py即可对图片数据加载进行训练。可以看到第一轮的10个类别的平均精度达到51%左右。
训练得到的模型保存在logs文件下,然后我们运行python 03pyqt.py可生成可视化的界面,加载训练好的模型,对输入的图片进行预测。