PyCharm中配置PaddleOCR实现图片中文字的识别

黑灰白格

已于 2024-02-22 19:03:59 修改

阅读量2.8k

点赞数 42

文章标签： pycharm python paddle

于 2024-02-21 14:58:45 首次发布

本文链接：https://blog.csdn.net/weixin_50602154/article/details/136208656

版权

本文详细指导如何在Windows环境下安装Paddle深度学习框架及其配套的PaddleOCR工具，包括创建虚拟环境、检查系统要求、更换镜像源、安装CUDA/CUDNN以及在PyCharm中使用PaddleOCR。

摘要由CSDN通过智能技术生成

快速安装

1、安装Paddle

conda install paddlepaddle-gpu==2.6.0 cudatoolkit=11.7 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge

检验是否成功

import paddle

paddle.utils.run_check()

2、安装PaddleOCR

pip install “paddleocr>=2.0.1” --upgrade PyMuPDF==1.21.1

一、环境准备

1.1 创建虚拟环境

创建Anaconda虚拟环境，并指定python版本，PaddleOCR支持的python版本为 3.8 - 3.12。这里仅以3.11.2版本为例。

conda create -n paddle python=3.11.2

进入paddle虚拟环境

conda activate paddle

1.2 检查系统环境

python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"

确认 Python 和 pip 是 64bit，并且处理器架构是 x86_64（或称作 x64、Intel 64、AMD64）架构。下面的第一行输出的是”64bit”，第二行输出的是”x86_64（或 x64、AMD64）”即可。

二、安装PaddleOCR

2.1 更改镜像源为清华镜像（可选）

2.1.1 取消现有镜像地址：

conda config --remove-key channels

2.1.2 设置清华镜像地址：

conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/win-64/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --set show_channel_urls yes
conda config --set ssl_verify yes

根据版本进行安装，如果电脑有英伟达显卡的话可以选择cuda版本的，否则可以安装CPU版本的，官网地址：飞桨PaddlePaddle-源于产业实践的开源深度学习平台

根据自己的版本进行选择安装。这里使用conda一直安装失败，采用pip命令安装。(不妨多等等）

conda install paddlepaddle-gpu==2.6.0 cudatoolkit=11.7 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge

2.2 验证安装是否成功

输入python命令进入python编译器，依次输入以下命令：

2.2.1 导入paddle包

import paddle

2.2.2 运行paddle中的run_check()方法进行检查。

paddle.utils.run_check()

运行结果中显示PaddlePaddle is installed successfully! 则表示安装成功！

报错如下：

原因：CUDA、CUDNN均为安装！之前在pyTorch安装的时候看到的CUDA是显卡预装的驱动运行时。故还需要去官网安装。

简单验证电脑是否装了CUDA和CUDNN，若已安装则有C:\Program Files\NVIDIA GPU Computing Toolkit路径，而不是只有C:\Program Files\NVIDIA Corporation路径。

2.3 CUDA和CUDNN的安装（已安装的忽略）

2.3.1 CUDA安装

官网地址：CUDA Toolkit Archive | NVIDIA Developer

选择合适的版本，例如我选择的是11.7版本，因为Paddle中有该版本命令。此外，建议选择exe (network)版进行安装，比较小。

安装过程无脑下一步就会，默认路径即可。

2.3.2 CUDNN安装

CUDNN官网：cuDNN Archive | NVIDIA Developer

这里我选择的也是对应CUDA11.x版本的CUDNNv8.4.1

将下载好的压缩包解压，然后将里面所以的内容复制粘贴到刚才CUDA的安装路径中（C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7）

然后清空conda环境重新安装

conda clean -all

使用conda安装时依然存在问题：

故直接采用pip命令进行安装

python -m pip install paddlepaddle-gpu==2.6.0.post117 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html

再次进行测试PaddleOCR环境，安装成功！！

补充：查看电脑中CUDA、CUDNN的版本号

CUDA版本号，cmd输入

nvcc --version

CUDNN的版本号需要进入目录：C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\include下的cudnn_version.h中查看。记事本编辑打开划到最后可以查看到CUDNN版本为8.4.1

3 安装PaddleOCR whl包

pip install paddleocr>=2.0.1 # 推荐使用2.0.1+版本

安装过程中可能出现错误，如下：

安装paddleocr 的时候指定PyMuPDF版本

pip install “paddleocr>=2.0.1” --upgrade PyMuPDF==1.21.1

到此，PaddleOCR的环境已经配置完成。

三、在PyCharm中使用PaddleOCR

从PaddleOCR官网中下载需要的代码，链接如下：https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.7/doc/doc_ch/models_list.md

本文以英文检测模型为例。

下载并解压后

创建一个test.py文件进行测试

from paddleocr import PaddleOCR

if __name__ == '__main__':
    ocr = PaddleOCR(use_angle_cls=True, use_gpu=False, det_model_dir=r"./inference/ch_ppocr_server_v1.1_det_infer",
                    rec_model_dir=r"./inference/ch_ppocr_server_v1.1_rec_infer",
                    cls_model_dir=r"./inference/ch_ppocr_mobile_v1.1_cls_infer")  # 使用CPU预加载，不用GPU
    text_list = ocr.ocr("images/11.jpg", cls=True)  # 打开图片文件
    # print(text)

    # 打印所有文本信息
    tiny_dict = {}
    i = 0
    for t in text_list:
        tiny_dict.update({'key'+str(i): t[-1][0]})
        i += 1
    print(tiny_dict)

运行结果如下：