pytesseract 识别验证码

 使用 tesseract 技术,练习验证码识别技术

#!/usr/bin/env python
# -*- coding:utf-8 -*-


import pytesseract

import urllib
import urllib.request

from PIL import  Image


url = 'https://so.gushiwen.org/RandCode.ashx'

urllib.request.urlretrieve(url=url,filename='./captcha.jpg')

image = Image.open('./captcha.jpg')

image.show()

# # 识别之前修改这张图片TODO
def deal_captcha(image):
    # 黑白的图片
    image = image.convert('L')

    # 图片中的数据二维数组[[209,156,……],[],[]]
    data = image.load()

    w,h= image.size
    # 颜色范围0~255
    # 255纯白
    # 0纯黑
    for i in range(w):
        for j in range(h):
            if data[i,j] > 100:
                data[i,j] = 255
            else:
                data[i,j] = 0
    return image

image = deal_captcha(image)
str = pytesseract.image_to_string(image)

print(str)


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值