windows10通过anaconda安装paddle和paddleOCR并将图片转为excel

最新推荐文章于 2024-03-02 12:11:18 发布

岐伯

最新推荐文章于 2024-03-02 12:11:18 发布

阅读量4.4k

点赞数 17

文章标签： paddle paddlepaddle python

本文链接：https://blog.csdn.net/qq_39898066/article/details/123553021

版权

首先安装anaconda，详细流程：直接在其官网下载即可直接默认安装即可。

然后进入anaconda的prompt窗口

在该窗口中创建paddle的虚拟环境，python版本为3.7，详细流程：直接在窗口中输入该命令语句即可conda create --name paddle python=3.7

创建好虚拟环境后，通过activate激活环境

如何进入百度飞浆的官网

根据本机的CUDA版本进行选择，可以选择比自己版本低的。CUDA的版本查看详细步骤如下。

本机CUDA版本为11.3

因此根据本机CUDA版本选择了低版本的CUDA10.2进行安装

安装步骤是直接将该命令复制到刚刚激活paddle环境的命令框中

安装完成后，输入python进入编译环境

然后输入import paddle

再输入paddle.utils.run_check()进行验证是否安装成功

如果出现successfully则表明安装成功

输入exit()退出编译环境

接下来安装paddleocr，首先在github上搜索paddleOCR

选择被收藏最多的

然后进行下载

下载完成后将其解压

然后在命令窗口中将访问路径设置为当前路径，详细步骤，直接输入当前路径磁盘名F:进行跳转

再输入cd+当前路径即可跳转

跳转完成后通过pip inastall -r requirements.txt安装PaddleOCR需要依赖库

安装完成后如图所示

再通过python setup.py install安装PaddleOCR

安装完成后，我们直接进入pycharm，创建一个测试程序


import cv2
from paddleocr import PPStructure,draw_structure_result,save_structure_res
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
table_engine = PPStructure(show_log=True)

save_folder = 'output'
img_path = 'photo/table1.png'
img = cv2.imread(img_path)
result = table_engine(img)
save_structure_res(result, save_folder,os.path.basename(img_path).split('.')[0])

for line in result:
    line.pop('img')
    print(line)

from PIL import Image

font_path = '../doc/fonts/simfang.ttf' # PaddleOCR下提供字体包
image = Image.open(img_path).convert('RGB')
im_show = draw_structure_result(image, result,font_path=font_path)
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

可以发现导入paddle库时报错，这是因为pycharm还没有切换环境造成的

切换环境的详细步骤：首先进入设置

然后进入项目

进入解释器

点击添加环境

选择conda环境

选择当前环境

浏览环境位置

Paddle的环境是按照在anaconda的虚拟环境中的

选择paddle环境文件夹中的python文件即可

然后点击确定

然后在点击应用后确定操作

导入环境后便不再报错

然后创建两个文件夹用于放置输出的结果和识别的图片，详细步骤：首先点击项目右键

选择新建文件夹

然后将其命名为output

同样的步骤创建photo文件夹

可将根目录下的图片直接拖到photo文件夹中即可。

然后将程序中的输出文件的保存路径进行替换

保存路径可以通过右键output文件夹，选择复制路径

复制相对路径

然后将保存路径进行替换

图片路径也是相同的操作进行替换

然后检测测试程序发现缺少字体文件

该文件在paddleOCR中

直接将该文件夹复制到程序根目录即可

运行程序后发现缺少layoutparser库

然后进入paddle的命令窗口进行安装即可，安装命令为

pip3 install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl

然后pycharm会自动更新运行环境的变动

然后重新运行程序出现了OMP报错

该错误是因为运行核死亡导致的，只需要添加

import os

os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

程序编译运行，即识别完成输出了一个excel文件

对比图片识别的效果很不错

岐伯

关注

17
点赞
踩
43

收藏

觉得还不错? 一键收藏
4
评论
windows10通过anaconda安装paddle和paddleOCR并将图片转为excel

首先安装anaconda，详细流程：直接在其官网下载即可直接默认安装即可。然后进入anaconda的prompt窗口在该窗口中创建paddle的虚拟环境，python版本为3.7，详细流程：直接在窗口中输入该命令语句即可conda create --name paddlepython=3.7创建好虚拟环境后，通过activate激活环境如何进入百度飞浆的官网根据本机的CUDA版本进行选择，可以选择比自己版本低的。CUDA的版本查看详...
复制链接

扫一扫