PaddleOCR简单使用教程-Windows

说明

最近公司业务需要用到图文识别类似的功能,所以查阅了许多工具之后选择用百度开源的PaddleOCR来进行使用

先看官方简介:
百度飞桨PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落,支持多种OCR相关前沿算法,在此基础上打造产业级特色模型PP-OCR和PP-Structure,并打通数据生产、模型训练、压缩、预测部署全流程
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。
在这里插入图片描述在这里插入图片描述
PaddleOCR官方主页:https://www.paddlepaddle.org.cn/
GitHub地址:https://github.com/PaddlePaddle/PaddleOCR
Gitee地址:https://gitee.com/paddlepaddle/PaddleOCR

实现功能

网上很多教程,官方也有文档,我结合官方的文档和自己的使用来进行说明

准备Python环境

因为paddle整个工具依赖Python环境,所以首先要准备好Python环境
如果本身就有的就不说了,如果没有的可以通过两种方式进行安装,这里我通过官方推荐的安装Anaconda工具包来集成Python环境,推荐对Python不熟练的都使用这种方式,因为他会自动帮我们安装很多依赖包,省去了很多的麻烦

安装Anaconda

Anaconda的安装很简单,一般都不会出问题,所以我就直接把官方的步骤写在下面
清华大学的镜像地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D
官方地址:https://docs.anaconda.com/anaconda/install/hashes/win-3-64/

这里两个都可以,根据自己网络选择安装

下载完成后,双击安装程序进入图形界面

默认安装位置为C盘,建议将安装位置更改到D盘:
在这里插入图片描述

勾选conda加入环境变量,忽略警告:
在这里插入图片描述
打开终端并创建conda环境

打开Anaconda Prompt终端:左下角Windows Start Menu -> Anaconda3 -> Anaconda Prompt启动控制台

在这里插入图片描述
创建新的conda环境

# 在命令行输入以下命令,创建名为paddle_env的环境
# 此处为加速下载,使用清华源 官方推荐安装3.8的python,我这里安装3.10
conda create --name paddle_env python=3.10 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/  

激活刚创建的conda环境,在命令行中输入以下命令:

# 激活paddle_env环境
conda activate paddle_env
# 查看当前python的位置
where python

安装PaddleOCR

我下面所有的命令安装后面都跟了-i https://mirror.baidu.com/pypi/simple 这是指定他的源是百度那边,如果不加这个会很慢,所以建议后面的安装都加上相关指定

安装Paddle

根据自己机器选择GPU还是CPU的版本,GPU还分了10和9,可自行查看
这里是CPU版本,所以安装的是CPU版本

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

安装好之后可以在python的依赖包目录里面查看是否安装成功,windows的路径一般都在你的python安装路径\Lib\site-packages里面
在这里插入图片描述

安装PaddleOCR包

这里网上有两种安装方式,一种是官方推荐的直接全局安装PaddleOCR,这样后面就可以直接在任意位置进行命令调取,还有一种是安装解压包然后进行使用,我两者都有使用

全局安装

pip install paddleocr -i https://mirror.baidu.com/pypi/simple

这里的安装很有可能会报错,一般都是缺少模块的问题,看报的错误缺少什么模块就用pip把相关模块安装好之后再安装就行了
如果还是报错可以手动下载相关模块的shapely安装包完成安装,地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely

还是老样子,安装好之后可以在python的依赖包目录下面查看
在这里插入图片描述

解压包安装

在github或者gitee上面可以下载相关的解压包
在这里插入图片描述
然后在当前路径下通过命令进行相关模块的安装

pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

中途可能会报错

note: This error originates from a subprocess, and is likely not a problem with pip.
ERROR: Failed building wheel for lanms-neo
Failed to build lanms-neo
ERROR: Could not build wheels for lanms-neo, which is required to install pyproject.toml-based projects

这里我查阅了很多资料,有说指定paddleocr版本为2.0.6的,有说缺少c++环境的,经过我自己的测试,发现应该是缺少c++环境导致,然后网上一些说缺少这个版本,一些说缺少那个版本,实在看的我眼花,最后索性直接通过Visual Studio installer工具进行相关项的安装
在这里插入图片描述

在这里插入图片描述
我是安装了这几个组件,安装好之后最好重启一下电脑
然后再次通过命令安装相关的依赖模块就不报错了,成功安装好需要的包

运行

把图片放到指定的路径,然后运行命令

paddleocr --image_dir ./imgs/11.jpg --use_angle_cls true --use_gpu false

最后控制台输出结果:
在这里插入图片描述
大功告成!

模型下载

在这里插入图片描述

paddleocr提供了很多推理模型供我们下载,想要对于不同场景进行识别,需要下载相应的模型
下载地址:https://gitee.com/paddlepaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/models_list.md
下载好之后在paddlerocr的目录下面新建inference文件夹,然后把模型解压后的包放进去,启动的时候可以通过参数指定模型即可

  • 4
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
PaddleOCR PP-Structurev2是一个基于PaddlePaddle深度学习框架的OCR工具,可以实现文字识别、表格识别、印章识别等功能。以下是PP-Structurev2的使用教程: 1. 安装PaddleOCR 首先需要安装PaddleOCR。可以使用以下命令进行安装: ``` pip install paddleocr ``` 2. 下载PP-Structurev2模型 PP-Structurev2依赖于特定的模型,需要下载对应的模型文件。可以从PaddleOCR的GitHub仓库中下载: ``` git clone https://github.com/PaddlePaddle/PaddleOCR.git cd PaddleOCR wget https://paddleocr.bj.bcebos.com/PP-Structure_v2/ch/ch_ppocr_server_v2.0_rec_infer.tar wget https://paddleocr.bj.bcebos.com/PP-Structure_v2/ch/ch_ppocr_mobile_v2.0_cls_infer.tar wget https://paddleocr.bj.bcebos.com/PP-Structure_v2/ch/ch_ppocr_mobile_v2.0_det_infer.tar tar xf ch_ppocr_server_v2.0_rec_infer.tar tar xf ch_ppocr_mobile_v2.0_cls_infer.tar tar xf ch_ppocr_mobile_v2.0_det_infer.tar ``` 3. 使用PP-Structurev2 使用PP-Structurev2需要先加载模型。可以使用以下代码加载模型: ``` import paddleocr ocr = paddleocr.OCR( det_model_dir='ch_ppocr_mobile_v2.0_det_infer', rec_model_dir='ch_ppocr_server_v2.0_rec_infer', cls_model_dir='ch_ppocr_mobile_v2.0_cls_infer', use_angle_cls=True, lang='ch' ) ``` 加载模型后,就可以使用PP-Structurev2进行文字识别、表格识别、印章识别等操作。以下是一些示例代码: ``` # 文字识别 result = ocr.ocr('example.jpg') for line in result: print(line) # 表格识别 result = ocr.table_ocr('example.jpg') for table in result: for row in table: print(row) # 印章识别 result = ocr.seal_ocr('example.jpg') print(result) ``` 以上就是PP-Structurev2的使用教程。需要注意的是,PP-Structurev2的模型文件比较大,下载和加载模型可能需要花费一些时间。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值