ORC提取图片中文字

前因:

事情是这样的:目前有一个需求,将pdf中的一些内容做成PPT,PDF中的文字不能选中,是以图片形式保存的。如果人工对照PDF打字速度较慢,费时费力,下面不介绍ORC的实现,是介绍如何使用。

主题:

orc实现图片中的文字提取

实现:

1.安装

pip install cnocr

首次使用cnocr时,系统会自动从 cnocr-models 下载zip格式的模型压缩文件,并存于 ~/.cnocr目录。 下载后的zip文件代码会自动对其解压,然后把解压后的模型相关目录放于~/.cnocr/1.1.0目录中。

如果系统不能自动从 cnocr-models 成功下载zip文件,则需要手动下载此zip文件并把它放于 ~/.cnocr/1.1.0目录。如果Github下载太慢,也可以从 百度云盘 下载, 提取码为 ri27。

放置好zip文件后,后面的事代码就会自动执行了。
具体使用参照:这里

2.使用

需要提取文字的图片:
在这里插入图片描述
这里先贴上我的代码:

from cnocr import CnOcr
file = 'res.txt'

ocr = CnOcr()
res = ocr.ocr('1.jpg')

with open(file, 'w') as f1:
    f1.write("")

with open(file, 'a') as file_:
    f
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
orc(Optical Character Recognition,光学字符识别)是一种常见的图像处理技术,用于将图像文字转换成可编辑和可搜索的文本。orc截图文字识别提取是指将截取的屏幕截图文字提取出来。 orc截图文字识别提取的过程可以分为以下几个步骤: 1. 图像预处理:首先对截图进行预处理,包括调整图像的亮度、对比度和尺寸等。这可以提高后续的文字识别准确率。 2. 文字定位:通过文本定位算法,识别出截图文字区域。这可以帮助我们减少文字识别的范围,提高识别效率。 3. 文字分割:将文字区域进行分割,将每个字符分开。目的是为了将多个字符的识别任务拆分成单个字符的识别任务,提高准确率。 4. 字符识别:对每个字符进行识别,使用OCR算法将字符转换成对应的文本。常见的OCR算法包括基于规则的方法、统计学方法和深度学习方法等。 5. 文本后处理:对于识别结果进行后处理,包括字符校验、错误矫正等。这可以进一步提高文本识别的准确率和可靠性。 orc截图文字识别提取可应用于多种场景,例如将手机截图文字转化为可编辑的文本、提取网页截图文字或截取屏幕截图文字等。它具有重要的实际价值和广阔的应用前景。 需要注意的是,orc截图文字识别提取虽然在近年来取得了巨大的进展,但仍存在一定的限制和挑战。例如,识别率受到图片质量、文字特征、字体大小和字体样式等因素的影响。因此,在实际应用需要根据具体情况进行算法选择和参数优化,以提高识别效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值