DDDDOCR安装以及使用

DDDDOCR图片验证码识别技术

在我们日常浏览网页的时候,常常会弹出一张图片让你来验证,有的是滑动验证,有的是输入相应字符来进行验证,今天我就来给大家介绍这么一个技术,可以专门用来识别图片验证码的功能。

包下载

提到包下载,我们就会想到通过命令行pip install ddddocr或者通过pycharm框架中的添加包来实现。
在这里插入图片描述

但是在下载这个包的过程中总是在提醒存在以下错误:

C:\Users\Test>pip install ddddocr
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Collecting ddddocr
  Using cached https://pypi.tuna.tsinghua.edu.cn/packages/43/f7/febabbc3580e811accf89ca5236c7de0062b07adf535edc66587ff9149cb/ddddocr-1.0.6-py3-none-any.whl (6.9 MB)
Collecting numpy
  Using cached https://pypi.tuna.tsinghua.edu.cn/packages/73/39/f104eb30cc3da44d1e10622418c5e6eb5ac224f0f20c97dba44cf2de2af9/numpy-1.24.1-cp311-cp311-win_amd64.whl (14.8 MB)
ERROR: Ignored the following versions that require a different python version: 1.0.8 Requires-Python <3.8; 1.1.0 Requires-Python <3.9; 1.2.0 Requires-Python <3.10; 1.21.2 Requires-Python >=3.7,<3.11; 1.21.3 Requires-Python >=3.7,<3.11; 1.21.4 Requires-Python >=3.7,<3.11; 1.21.5 Requires-Python >=3.7,<3.11; 1.21.6 Requires-Python >=3.7,<3.11; 1.3.0 Requires-Python <3.10; 1.3.1 Requires-Python <3.10; 1.4.0 Requires-Python <3.10; 1.4.1 Requires-Python <3.10; 1.4.2 Requires-Python <3.10; 1.4.3 Requires-Python <3.10; 1.4.4 Requires-Python <=3.10; 1.4.5 Requires-Python <3.11; 1.4.6 Requires-Python <3.11; 1.4.7 Requires-Python <3.11
ERROR: Could not find a version that satisfies the requirement onnxruntime (from ddddocr) (from versions: none)
ERROR: No matching distribution found for onnxruntime

也是查了很多办法,指定国内镜像源,考虑版本更迭导致包名的改变等,都没啥效果,困扰了我几个小时后,沉下心来,再次打开-开发包的源地址https://github.com/sml2h3/ddddocr,此时再查看解释说明时,发现这个包目前只支持到python 3.10版本,而我目前的版本是最新的python 3.11.0。所以无法进行包的导入。
在这里插入图片描述
定位到了问题,那么就好解决了,这其中还遇到一个坑(也不算吧,有可能是自己没搞明白,后续在找补吧),其实按理说只需要将python版本回退到3.10就好了,但是不愿意卸载重装的我直接下了一个anaconda python管理包的一个工具,在这上面浪费了很多时间,今天暂时不做介绍了。

解决办法

1、卸载原来的Python版本,并且删除所存放Python的文件夹,我这里是D:\python,然后去官网随便找一个3.10版本下载即可,本人下载3.10.9https://www.python.org/downloads/release/python-3109/
在这里插入图片描述

2、安装下载的python包;

C:\Users\Test>python
Python 3.10.9 (tags/v3.10.9:1dd9be6, Dec  6 2022, 20:01:21) [MSC v.1934 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.

3、这时再下载ddddocr包与onnxruntime包,pip install ddddocrpip install onnxruntime,此时可以正常下载成功,如果不能用就在pycharm中在install一遍。

C:\Users\Test>pip install ddddocr
C:\Users\Test>pip install onnxruntime

4、重新创建一个project,解释器设成刚才下载的路径即可,创建py文件,开始编译。
在这里插入图片描述

包的使用

这里我是用下面这张图片:
在这里插入图片描述
然后创建一个.py文件,并且将上面图片放在和此.py文件同一目录下。

import ddddocr
# 实例化
ocr = ddddocr.DdddOcr()
# 以二进制格式打开verf.png图片用于只读
with open('verf.png', 'rb') as f:
	# 用来读取文件
	img_bytes = f.read()
# 识别图片中的内容
res = ocr.classification(img_bytes)
# 输出内容
print('识别出的验证码为:' + res)

执行结果如下:

D:\pythonProject\venv\Scripts\python.exe D:\pythonProject\venv\11.py 
欢迎使用ddddocr,本项目专注带动行业内卷,个人博客:wenanzhe.com
训练数据支持来源于:http://146.56.204.113:19199/preview
爬虫框架feapder可快速一键接入,快速开启爬虫之旅:https://github.com/Boris-code/feapder
谷歌reCaptcha验证码 / hCaptcha验证码 / funCaptcha验证码商业级识别接口:https://yescaptcha.com/i/NSwk7i
识别出的验证码为:jyfq

Process finished with exit code 0

这里作者将一些资料也打印出来了,如果不愿意用,可以通过CTEL+单击import ddddocr中的ddddocr,跳转至页面然后将不想看的文字注释掉:
在这里插入图片描述
然后再返回执行,结果如下:

D:\pythonProject\venv\Scripts\python.exe D:\pythonProject\venv\11.py 
识别出的验证码为:jyfq

Process finished with exit code 0

总结

在遇到问题,还是要从源头查找根因,因为太过着急,没有仔细查看作者对ddddocr包的说明,因此走了很多的弯路,综上,安装ddddocr包最重要的是要关注他的版本问题,本地如果可以进行安装,那么编写,编译将会顺风顺水。

  • 6
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: ddddocr 是一种 OCR(Optical Character Recognition,光学字符识别)工具,它可以用来将图片或者 PDF 中的文字转换为可编辑的文本。 使用 ddddocr 的步骤如下: 1. 安装 ddddocr。 2. 打开 ddddocr 并选择要转换的图片或 PDF。 3. 选择图片或 PDF 中的文字语言。 4. 点击“开始识别”按钮开始转换。 5. 转换完成后,可以在 ddddocr 的编辑界面中查看和编辑转换后的文本。 6. 如果需要,可以将转换后的文本保存为 TXT、DOCDOCX 等格式。 注意:ddddocr 可能会有识别误差,所以建议在使用 ddddocr 转换文本后再进行人工校对。 ### 回答2: ddddocr是一款基于OCR(Optical Character Recognition,光学字符识别)技术的文本识别工具,可以帮助用户将图片中的文字提取出来,并实现文字的识别与转换。以下是关于如何使用ddddocr的步骤: 1. 下载安装:在应用商店或者官方网站上搜索并下载ddddocr应用,然后按照提示进行安装。 2. 注册登录:打开应用后,根据提示选择注册账号或者使用已有账号登录。 3. 选择图片:点击应用界面上的“选择图片”按钮,浏览并选取要识别的图片。 4. 图片处理:在图片选择完成后,可以对图片进行裁剪、旋转、调整亮度等操作,以提高识别精度。 5. 文字识别:点击“开始识别”按钮,等待片刻,系统会快速将图片中的文字提取出来。 6. 文字编辑及导出:识别完成后,用户可以对识别结果进行编辑、校对等操作,然后选择保存或导出为文本文件。 7. 其他功能:ddddocr还提供了一些其他功能,如文字翻译、语音朗读等,用户可以根据需求进行操作。 需要注意的是,ddddocr的识别精度受到多种因素的影响,例如图片质量、文字清晰度等,请尽量选择清晰、无干扰的图片进行识别,以获得最佳的识别结果。另外,该应用在识别过程中可能需要连接网络进行云端识别,因此需要确保手机或设备的网络连接正常稳定。 综上所述,ddddocr是一款方便易用的OCR文字识别工具,通过简单的几步操作,用户可以快速提取并识别图片中的文字,并进行相应的编辑和导出。无论是需要将图片文字转换为文本,还是进行文字翻译等操作,ddddocr都可以提供帮助。 ### 回答3: ddddocr是一款在线文字识别工具,可以将图片中的文字内容进行快速准确地识别,并转换为可编辑的文本格式。使用ddddocr非常简单,只需要按照以下步骤进行操作: 1. 打开ddddocr网页,网址为 www.ddddocr.com 。 2. 首先,您需要选择图片文件进行上传。可以点击网页上的“选择文件”按钮,然后在弹出的文件选择对话框中找到并选中需要识别的图片文件,最后点击“打开”按钮进行上传。您也可以直接将图片文件拖放到网页上的指定区域中实现上传。 3. 图片上传完成后,ddddocr会自动开始进行文字识别。在识别过程中,请耐心等待。 4. 识别完成后,您可以在网页上看到图片中的文字内容。如果需要,可以进行编辑、复制、保存等操作。此外,ddddocr还支持将识别结果导出为Word、Excel、PDF等格式文件。 需要注意的是,ddddocr在识别过程中,可能受到图片质量、光线条件、文字排列方式等因素的影响,因此有时识别结果可能会有一定的误差。为了获得更好的识别效果,建议使用清晰度较高、文字清晰可见的图片进行识别。 总之,ddddocr是一个方便实用的在线文字识别工具,使用简单、操作便捷。无论是需要识别文档、照片、截图等场景,都可以选择ddddocr进行文字识别,提高工作、学习的效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值