PaddleOCR环境搭建并简单提取文字

根据官方gitee仓库Readme总结:
https://gitee.com/paddlepaddle/PaddleOCR/

Windows下配置Anaconda环境

  1. 官方下载地址:https://www.anaconda.com/download/success
  2. 下载完成后默认安装即可。
  3. 打开Anoconda Prompt命令行工具
    在这里插入图片描述
  4. 命令安装
# 使用清华源创建 ml_env环境
conda create --name ml_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
# 使用环境
conda activate ml_env
# CPU 版 paddle
pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple
# GPU 版 paddle
pip install paddlepaddle-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple
# paddleocr工具包
pip install paddleocr  -i  https://pypi.tuna.tsinghua.edu.cn/simple

Pycharm使用创建的Anaconda环境

  1. conda info 查看环境路径
    在这里插入图片描述
  2. 打开pycharm设置,搜索Python Interpretershow all等如图操作
    在这里插入图片描述在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  3. 找到安装的ml_env运行环境目录
    在这里插入图片描述
  4. 选择后应用即可。

使用PaddleOCR 提取文字

图片可自行准备

from paddleocr import PaddleOCR, draw_ocr
from PIL import Image


# paddleocr目前支持中英文、英文、法语、德语、韩语、日语等80个语种,可以通过修改lang参数进行切换
ocr = PaddleOCR(use_angle_cls=False, lang="ch")  # need to run only once to download and load model into memory


img_path = "./test_img/hetong2.jpg"
result = ocr.ocr(img_path, cls=False)
line = []
for line in result:
    result = line
# 可视化结果


image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='./simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.show()

运行后如图:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值