视频演示和demo仓库地址找066期:
到此一游7758258的个人空间_哔哩哔哩_bilibili
效果图如下:
图片中的文本皆被检测到
代码所有文件:
运行01makeTxt.py会将data文件下的图片路径及标签保存在txt文本内,
运行02train.py会对图片进行读取并训练模型保存在runs文件下,
运行03detector_photo.py会对单张图片进行预测,
运行04pyqt界面.py可以展示一个pyqt的可视化交互界面,通过点击按钮加载感兴趣的图片进行识别。
科普下卷积神经网络相关知识:
CNN是卷积神经网络(Convolutional Neural Network)的缩写。它是一种前馈神经网络,特别适用于处理具有网格状结构的数据,例如图像、视频和声音等。CNN由多个卷积层、池化层和全连接层组成。
CNN的核心思想是通过卷积操作和池化操作来提取输入数据中的特征。卷积层使用卷积核对输入数据进行滑动窗口操作,以捕捉不同位置的局部特征。通过堆叠多个卷积层,网