网络图像的文本识别（阿里天池竞赛）

最新推荐文章于 2024-06-03 14:13:26 发布

NUDTDING2019

最新推荐文章于 2024-06-03 14:13:26 发布

阅读量2.8k

点赞数 2

分类专栏：数据挖掘大作业文章标签：图像文本

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/NUDTDING2019/article/details/92799004

版权

网络图片的文本识别的文档描述

实验目的
实验步骤
tesseract.exe所在的文件路径
获取图片中像素点数量最多的像素
按照阈值进行二值化处理
threshold: 像素阈值
去掉二值化处理后的图片中的噪声点
识别图片中的数字加字母
传入参数为图片路径，返回结果为：识别结果

实验目的

本文将具体介绍如何利用Python的图像处理模块pillow和OCR模块pytesseract来识别平常生活中我们所见到的验证码（数字加字母）。

实验步骤

我们识别上述验证码的算法过程如下：

首先我们先将原图像进行灰度处理，就是我们所选择的验证码图片转化为灰度图像；
然后获取图片中像素点数量最多的像素（此为图片背景），以此图片像素设置阈值，采用扫描的方法消除图像中差值小于阈值的颜色，对此图像进行二值化处理，将灰度图像转化为黑白图像（用来提高识别的准确率）；
最后去掉黑白图像中的噪声，噪声定义为：以该点为中心的九宫格的黑点的数量小于等于4；
利用pytesseract模块识别，去掉识别结果中的特殊字符，获得识别结果。
我们的图片如下，这里我们将图片放在一张图片上（共9张图片）：

import os
import pytesseract
from PIL import Image
from collections i

最低0.47元/天解锁文章

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
网络图像的文本识别（阿里天池竞赛）

网络图片的文本识别的文档描述实验目的实验步骤tesseract.exe所在的文件路径获取图片中像素点数量最多的像素按照阈值进行二值化处理threshold: 像素阈值去掉二值化处理后的图片中的噪声点识别图片中的数字加字母传入参数为图片路径，返回结果为：识别结果实验目的本文将具体介绍如何利用Python的图像处理模块pillow和OCR模块pytesseract来识别平常生活中我们所见到的验证码...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。