PaddlePaddle飞浆搭建和机器学习文字识别

PaddlePaddle飞浆搭建和机器学习文字识别

文章转自:https://lingkang.top/archives/paddlepaddle-fei-jiang-da-jian-he-ji-qi-xue-xi-wen-zi-shi-bie

官网:https://www.paddlepaddle.org.cn/
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。

安装 PaddlePaddle 对python版本是有要求,2022年11月21日15:04:36最新的PaddlePaddle(2.3.2)不能用最新python安(3.11.0)装。可以使用3.7、3.8、3.9的python版本安装,其他版本我没测试,这里用的py3.9.13 下面的python版本为3.9.13 window install版

cmd执行安装飞浆

# 配置阿里云镜像
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

python -m pip install paddlepaddle==2.3.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hTrRjsXG-1669104078472)(/upload/2022/11/image-1669014423651.png)]
在这里插入图片描述

安装中
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NUwSVVd5-1669104078473)(/upload/2022/11/image-1669014438349.png)]
在这里插入图片描述

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。
安装PaddleOCR
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/quickstart.md

python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

安装PaddleOCR whl,用于调用

pip install "paddleocr>=2.3.2"

等待它安装完毕
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j0eVPNgt-1669104078474)(/upload/2022/11/image-1669014501408.png)]
在这里插入图片描述

图片识别
在Win+R的cmd执行,否则会找不到命令

paddleocr --image_dir ./Desktop/picture/微信图片_20220425094332.jpg --use_angle_cls true --use_gpu false

中英文检查:检测+方向分类器+识别全流程:
–use_angle_cls true设置使用方向分类器识别180度旋转文字,
–use_gpu false设置不使用GPU
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cXQ3Tf3d-1669104078474)(/upload/2022/11/image-1669014546924.png)]
在这里插入图片描述

在py代码中识别
idea安装了插件,创建一个项目
在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CN3NDY3V-1669104078474)(/upload/2022/11/image-1669014619606.png)]

编写识别代码

from paddleocr import PaddleOCR, draw_ocr

# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
img_path = './微信图片_20220425094332.jpg'
result = ocr.ocr(img_path, cls=True)
for idx in range(len(result)):
    res = result[idx]
    for line in res:
        print(line)

# 显示结果
from PIL import Image
result = result[0]
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='C:\\Windows\\Fonts\\simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

需要安装一些包
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TNDHOJbW-1669104078474)(/upload/2022/11/image-1669014635545.png)]
在这里插入图片描述
执行完毕
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ce8SLKxV-1669104078475)(/upload/2022/11/image-1669014640416.png)]
在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Tpctpwm5-1669104078475)(/upload/2022/11/image-1669014651560.png)]
在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

凌康ACG

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值