python文字验证码识别_利用python进行验证码识别（预处理部分）

最新推荐文章于 2024-05-06 19:18:04 发布

weixin_39684235

最新推荐文章于 2024-05-06 19:18:04 发布

阅读量344

点赞数

文章标签： python文字验证码识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39684235/article/details/111819064

版权

# -*- coding: utf-8 -*-

"""Created on Thu Feb 1 15:52:05 2018@author: Administrator"""

from PIL import Image

import os

import time #命名时用

import string #字符串模块

import shutil #文件复制粘贴等操作模块

path=r'C:\Users\Administrator\Desktop\python之图像识别\2.验证吗识别相关\pic(字母加数字加边框)'

path_save=r'C:\Users\Administrator\Desktop\python之图像识别\2.验证吗识别相关\归类\\'

path_save2=r'C:\Users\Administrator\Desktop\python之图像识别\2.验证吗识别相关\cut\\'

path_makedir=r'C:\Users\Administrator\Desktop\python之图像识别\2.验证吗识别相关\分类_识别\\'

path_copy_from=r'C:\Users\Administrator\Desktop\python之图像识别\2.验证吗识别相关\归类'

#import pytesseract #利用著名hp的软件tesseract来进行简单的规则的文字识别

##上面都是导包，只需要下面这一行就能实现图片文字识别

#text=pytesseract.image_to_string(Image.open(r'C:\Users\Administrator\Desktop\python之图像识别\pic\123.jpg'),lang='eng')

#print(type(text))

################以下为自定义阈值的二值化函数##############

def get_bin_table(threshold): #threshold为阈值

"""获取灰度转二值的映射table:param threshold::return:"""

table = []

for i in range(256):

if i < threshold:

table.append(0)

else:

table.append(1)

return table

##########################################################

################以下为去噪函数(简单的删除点)：：9邻域框,以当前点为中心的田字框,黑点个数##############

def sum_9_region(img, x, y): #为输入图片，xy分别为像素坐标，故使用其时需要用循环函数来厉遍图片里所有点

"""9邻域框,以当前点为中心的田字框,黑点个数:param x::param y::return:"""

# todo 判断图片的长宽度下限

cur_pixel = img.getpixel((x, y)) # 当前像素点的值

width = img.width

height = img.height

if cur_pixel == 1: # 如果当前点为白色区域,则不统计邻域值

return 0

if y == 0: # 第一行

if x == 0: # 左上顶点,4邻域

# 中心点旁边3个点

sum = cur_pixel \

+ img.getpixel((x, y + 1)) \

+ img.getpixel((x + 1, y)) \

+ img.getpixel((x + 1, y + 1))

return 4 - sum

elif x == width - 1: # 右上顶点

sum = cur_pixel \

+ img.getpixel((x, y + 1)) \

+ img.getpixel((x - 1, y)) \

+ img.getpixel((x - 1, y + 1))

return 4 - sum

else: # 最上非顶点,6邻域

最低0.47元/天解锁文章

weixin_39684235

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python文字验证码识别_利用python进行验证码识别（预处理部分）

# -*- coding: utf-8 -*-"""Created on Thu Feb 1 15:52:05 2018@author: Administrator"""from PIL import Imageimport osimport time #命名时用import string #字符串模块import shutil #文件复制粘贴等操作模块path=r'C:\Users\Adm...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。