python爬虫登录有验证码_python爬虫之获取验证码登陆

最新推荐文章于 2024-08-28 01:52:01 发布

weixin_39616056

最新推荐文章于 2024-08-28 01:52:01 发布

阅读量399

点赞数

文章标签： python爬虫登录有验证码

#--coding:utf-8

#author:wuhao

#这里我演示的就是本人所在学校的教育系统

import urllib.request

import urllib.parse

import re

import shutil

import http.cookiejar

class LoginJust():

def __init__(self,url,url1,url2,header,account,pwd):

self.url=url

self.url1=url1

self.url2=url2

self.header=header

self.account=account

self.pwd=pwd

return

#创建opener，包含header信息和cookie

def CreateOpener(self):

#实例化cookie对象

cookie=http.cookiejar.CookieJar()

#创建一个cookie处理器

CookieHandle=urllib.request.HTTPCookieProcessor(cookie)

#创建带有cookie的opener

opener=urllib.request.build_opener(CookieHandle)

#传入header

head=[]

for key,value in self.header.items():

elem=(key,value)

head.append(elem)

opener.open(self.url)

return opener

#获取验证码图片，并保存到本地

def getImage(self,opener):

path = "imageCode_1.jpg"

# 带cookie和header

img = opener.open(self.url2)

with open(path, "wb") as f:

shutil.copyfileobj(img, f)

#print(os.stat(path).st_size, ‘characters copied‘)

return

#获取后台发送来的字符串

def getResponse(self,opener):

getReponse = opener.open(self.url1)

gRResult = getReponse.read().decode("utf-8")

return gRResult

#获取post所需的encoded参数

def achieveCode(self,response):

# scode、sxh是response中得来

scode = response.split("#")[0]

sxh = response.split("#")[1]

# userAccount、userPassword

userAccount = self.account

userPassword =self.pwd

code = userAccount + "%%%" + userPassword

# 最终需要获取的post的数据

encode = ""

# 进行账号密码加密，获取code的值

i = 0

while (i < len(code)):

if i < 20:

encode = encode + code[i:i + 1] + scode[0:int(sxh[i])]

# print(str(i)+"_encode:"+encode)

scode = scode[int(sxh[i]):len(scode)]

# print(str(i)+"_scode:"+scode)

else:

encode = encode + code[i:len(code)]

# print(str(i)+"_here_encode"+encode)

i = len(code)

i = i + 1

return encode

#判断登陆是否成功

def IsLoginS(self,encoded):

#验证码的值

codeValue=input("请输入验证码：")

data={"useDogCode":"","encoded":encoded,"RANDOMCODE":codeValue}

#把data转换为post的数据格式

postData=urllib.parse.urlencode(data)

result=opener.open(self.url,postData.encode("utf-8"))

Result=result.read().decode("utf-8")

regex=re.compile(r"1440407133")

#print(type(regex.search(Result)))

if regex.search(Result)!=None:

return True

else:

print("Someting Error happened:登陆失败")

return False

#再次请求验证码

# 需要post的网址的URL

url = "http://jwgl.just.edu.cn:8080/Logon.do?method=logon"

# 获取后台数据的网址

url1 = "http://jwgl.just.edu.cn:8080/Logon.do?method=logon&flag=sess"

# 获取验证码图片的地址

url2 = "http://jwgl.just.edu.cn:8080/verifycode.servlet"

#header

header=\

{

"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36",

"Referer":"http://jwgl.just.edu.cn:8080/Logon.do?method=logon",

"Host":"jwgl.just.edu.cn:8080",

"Connection":"keep-alive",

"Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",

"Accept-Encoding":"gzip, deflate",

"Accept-Language":"zh-CN,zh;q=0.8",

"Upgrade-Insecure-Requests":"1",

"Cache-Control":"max-age=0",

}

account=input("请输入用户名：")

pwd=input("请输入密码：")

#实例化对象

lj=LoginJust(url,url1,url2,header,account,pwd)

opener=lj.CreateOpener()

lj.getImage(opener)

encoded=lj.achieveCode(lj.getResponse(opener))

if lj.IsLoginS(encoded):

print("登陆成功")

运行结果

weixin_39616056

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫