python核心教程:python识别验证码

本文介绍Python进行验证码识别的方法,包括使用PIL处理图像和pytesseract进行OCR识别,以及利用tensorflow进行训练。需要注意的是,tensorflow在Windows环境下不支持Python 2.7,测试时建议使用少量字符如0123以加快效果验证。
摘要由CSDN通过智能技术生成

这次给大家带来python识别验证码,python识别验证码的注意事项有哪些,下面就是实战案例,一起来看一下。
除了传统的PIL包处理图片,然后用pytessert+OCR识别意外,还可以使用tessorflow训练来识别验证码。

此篇代码大部分是转载的,只改了很少地方。

代码是运行在linux环境,tessorflow没有支持windows的python 2.7。

gen_captcha.py代码。
#coding=utf-8

from captcha.image import ImageCaptcha # pip install captcha

import numpy as np

import matplotlib.pyplot as plt

from PIL import Image

import random

# 验证码中的字符, 就不用汉字了

number = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']

alphabet = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u',

      'v', 'w', 'x', 'y', 'z']

ALPHABET = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U',

      'V', 'W', 'X', 'Y', 'Z']

'''

number=['0','1','2','3','4','5','6','7','8','9']

alphabet =[]

ALPHABET =[]

'''

# 验证码一般都无视大小写;验证码长度4个字符

def random_captcha_text(char_set=number + alphabet + ALPHABET, captcha_size=4):

  captcha_text = []

  for i in range(captcha_size):

    c = random.choice(char_set)

    captcha_text.append(c)

  return captcha_text

# 生成字符对应的验证码

def gen_captcha_text_and_image():

  while(1):

    image = ImageCaptcha()

    captcha_text = random_captcha_text()

    captcha_text = ''.join(captcha_text)

    captcha = image.generate(captcha_text)

    #image.write(captcha_text, captcha_text + '.jpg') # 写到文件

    captcha_image = Image.open(captcha)

    #captcha_image.show()

    captcha_image = np.array(captcha_image)

    if captcha_image.shape==(60,160,3):

      break

  return 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值