基于YOLO-fastest-xl的OCR

基于YOLO-fastest-xl的OCR

github链接https://github.com/qqsuhao/yolo-fastest-with-CRNN-for-OCR

项目介绍

  • 本项目参考chineseOCR项目,使用了其代码架构和CRNN部分相关的代码与训练模型。
  • 基于pytorch进行训练,基于opencv的dnn模块进行推理。
  • 本项目的主要区别在于将yolov3的模型替换为yolo-fastest-xl,使得原本大小为200MB左右的模型缩减为3.5MB。
  • 发现了chineseOCR中的一处bug:在本项目的crnn/opencv_dnn_detect.py的text_detect函数中的33-35行,改为36-38行。

对于yolo-fastest-xl的结构的更改

  • 原本的yolo-fastest-xl模型只有两层yolo层,难以应对小目标检测,尤其是文本检测。因此增加一层yolo层,更改后的模型文件存放于yolo/configs/yolo-fastest-xl-3yolo.cfg中。

运行方法

  • 克隆本项目以后安装相关的运行环境。
  • 建议使用pycharm打开本项目,使用vscode的话可能会出现import文件路径错误。
  • 在configs.py中进行配置。其他参数不用更改,需要关注第16行。如果使用第16行,则为使用yolov3进行推理,如果使用第17行,则为使用yolo-fastest-xl进行推理。
    运行demo.py就可以完成文字检测到识别的整个过程。
    由于yolo-fastest-xl权值文件较小,所以随着项目一起上传。但是yolov3的权值文件太大,没有上传。读者可以从文末的链接下载(包含yolov3的权值和crnn的权值),然后把所有文件放在yolov3-ocr/weights中。
  • 其他关键文件说明:
    • yolo/Toonnx.py 该文件将模型加载权值以后将模型转换为onnx文件。demo.py中的推理是使用onnx文件完成的。
    • yolo/weights 和 yolo/checkpoints中存放着相关的权值文件,yolo/checkpoints是训练过程中存放断点的文件夹。
    • yolo/中的大部分文件都和我其他的的yolo-fastest-xl相关的项目一致,可以参考我的其他项目。

效果总结

  • 在test_samples/0.jpg上进行测试,yolov3需要0.8s左右,yolo-fastest-xl需要0.4s左右。
  • demo.py中有些参数在不同的模型和测试样本下可能需要进行微调。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
作为AI助手,我需要提醒您,YOLO-Fastest V2是一个深度学习模型,需要GPU进行训练和推理。如果您没有GPU,那么您需要使用云计算服务来部署模型。 以下是在Windows 10上部署YOLO-Fastest V2的步骤: 1. 安装Anaconda 在Windows 10上安装Anaconda,可以使用Anaconda Navigator来管理Python环境和包。 2. 安装CUDA和cuDNN YOLO-Fastest V2需要CUDA和cuDNN来加速深度学习训练和推理。您可以从NVIDIA官网下载适合您的版本。 3. 克隆YOLO-Fastest V2的代码库 在命令行中使用以下命令克隆YOLO-Fastest V2的代码库: ``` git clone https://github.com/dog-qiuqiu/Yolo-Fastest.git ``` 4. 安装依赖库 进入代码库目录,使用以下命令安装依赖库: ``` pip install -r requirements.txt ``` 5. 下载预训练权重文件 在YOLO-Fastest V2的GitHub页面中,您可以找到预训练权重文件的下载链接。将下载的权重文件保存到代码库目录中。 6. 修改配置文件 在代码库目录中,将`yolo_fastest.py`文件中的`model_path`和`anchors_path`变量修改为您下载的预训练权重文件和锚点文件的路径。 7. 运行YOLO-Fastest V2 在命令行中使用以下命令运行YOLO-Fastest V2: ``` python yolo_fastest.py ``` 8. 测试YOLO-Fastest V2 在运行YOLO-Fastest V2后,您可以使用摄像头或视频来测试模型的效果。按下“q”键退出测试。 以上就是在Windows 10上部署YOLO-Fastest V2的步骤。如果您遇到任何问题,请参考YOLO-Fastest V2的GitHub页面或咨询相关专业人员。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值