windows10通过anaconda安装paddle和paddleOCR并将图片转为excel

首先安装anaconda,详细流程:直接在其官网下载即可直接默认安装即可。

然后进入anaconda的prompt窗口

 

在该窗口中创建paddle的虚拟环境,python版本为3.7,详细流程:直接在窗口中输入该命令语句即可conda create --name paddle python=3.7

 

创建好虚拟环境后,通过activate激活环境

 

 

如何进入百度飞浆的官网

 

根据本机的CUDA版本进行选择,可以选择比自己版本低的。CUDA的版本查看详细步骤如下。

 

 

 

 

本机CUDA版本为11.3

 

因此根据本机CUDA版本选择了低版本的CUDA10.2进行安装

 

安装步骤是直接将该命令复制到刚刚激活paddle环境的命令框中

 

 

安装完成后,输入python进入编译环境

 

然后输入import paddle

 

再输入paddle.utils.run_check()进行验证是否安装成功

 

如果出现successfully则表明安装成功

 

输入exit()退出编译环境

 

接下来安装paddleocr,首先在github上搜索paddleOCR

 

选择被收藏最多的

 

然后进行下载

 

下载完成后将其解压

 

然后在命令窗口中将访问路径设置为当前路径,详细步骤,直接输入当前路径磁盘名F:进行跳转

 

再输入cd+当前路径即可跳转

 

跳转完成后通过pip inastall -r requirements.txt安装PaddleOCR需要依赖库

 

安装完成后如图所示

 

再通过python setup.py install安装PaddleOCR

 

安装完成后,我们直接进入pycharm,创建一个测试程序


import cv2
from paddleocr import PPStructure,draw_structure_result,save_structure_res
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
table_engine = PPStructure(show_log=True)

save_folder = 'output'
img_path = 'photo/table1.png'
img = cv2.imread(img_path)
result = table_engine(img)
save_structure_res(result, save_folder,os.path.basename(img_path).split('.')[0])

for line in result:
    line.pop('img')
    print(line)

from PIL import Image

font_path = '../doc/fonts/simfang.ttf' # PaddleOCR下提供字体包
image = Image.open(img_path).convert('RGB')
im_show = draw_structure_result(image, result,font_path=font_path)
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

 

可以发现导入paddle库时报错,这是因为pycharm还没有切换环境造成的

 

切换环境的详细步骤:首先进入设置

 

然后进入项目

 

进入解释器

 

点击添加环境

 

选择conda环境

 

选择当前环境

 

浏览环境位置

 

Paddle的环境是按照在anaconda的虚拟环境中的

 

选择paddle环境文件夹中的python文件即可

 

然后点击确定

 

然后在点击应用后确定操作

导入环境后便不再报错

 

 

 

然后创建两个文件夹用于放置输出的结果和识别的图片,详细步骤:首先点击项目右键

 

选择新建文件夹

 

然后将其命名为output

 

同样的步骤创建photo文件夹

 

可将根目录下的图片直接拖到photo文件夹中即可。

 

然后将程序中的输出文件的保存路径进行替换

 

保存路径可以通过右键output文件夹,选择复制路径

 

复制相对路径

 

然后将保存路径进行替换

 

图片路径也是相同的操作进行替换

 

然后检测测试程序发现缺少字体文件

 

该文件在paddleOCR中

 

直接将该文件夹复制到程序根目录即可

 

运行程序后发现缺少layoutparser库

 

然后进入paddle的命令窗口进行安装即可,安装命令为

pip3 install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl

 

然后pycharm会自动更新运行环境的变动

 

然后重新运行程序出现了OMP报错

 

该错误是因为运行核死亡导致的,只需要添加

import os

os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

 

程序编译运行,即识别完成输出了一个excel文件

 

对比图片识别的效果很不错

 

  • 17
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值