python模拟登陆

原理:

访问web浏览器会向web服务器发送一个http request,web服务器接收到请求后响应发回http response,然后浏览器接收到响应将网页展现给用户

requestresponse都由起始行,消息头,指示消息头结束的空行和可选消息体构成。

 

request中起始行包括请求方法,请求资源,http版本协议号

消息头包含各种属性

消息体包含数据

 

response中起始行包括HTTP协议版本,HTTP状态码和状态

消息头包含属性

消息体包含服务器返回的数据内容

 

cookie

当用户首次访问一个域名,web服务器给客户端发送数据以保持连通,这些数据就是cookie

cookie用来记录用户登录状态

cookieHTTP消息头的一种属性,包括Name Vlaue Expires/Max-Age(过期时间) Path(作用路径) Domain(所在域名) Secure(安全连接)

前两个必须 

 

 

模拟登陆

设置CookieJar

构造header,PostData

post

 

 

 

安大财务处模拟登陆

import urllib
import urllib.request
import http.cookiejar
import urllib.parse

#登录的主页面
hosturl = 'http://cwch.ahu.edu.cn/querynetweb/' #自己填写
#post数据接收和处理的页面(我们要向这个页面发送我们构造的Post数据)
posturl = 'http://cwch.ahu.edu.cn/querynetweb/logins.aspx' #从数据包中分析出,处理post请求的url

#设置一个cookie处理器,它负责从服务器下载cookie到本地,并且在发送请求时带上本地的cookie
cj = http.cookiejar.LWPCookieJar()#创建一个CookieJar实例,用在存储和使用Cookie
cookie_support = urllib.request.HTTPCookieProcessor(cj)#用HTTPCookieProcessor处理获取的Cookie
opener = urllib.request.build_opener(cookie_support, urllib.request.HTTPHandler)#返回一个opener实例
urllib.request.install_opener(opener)#要打开一个url必须安装opener

#打开登录主页面(他的目的是从页面下载cookie,这样我们在再送post数据时就有cookie了,否则发送不成功)
h = urllib.request.urlopen(hosturl)

#构造header,一般header至少要包含一下两项。这两项是从抓到的包里分析得出的。
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:32.0) Gecko/20100101 Firefox/32.0',
           'Referer' : 'http://cwch.ahu.edu.cn/querynetweb/'}
#构造Post数据,他也是从抓大的包里分析得出的。
postData = {
             'Login1$LoginButton' : 'È·¶¨',
             'Login1$Password' : '******',
             'Login1$UserName' : '*****',
             '__EVENTVALIDATION' : '/wEWBQL+jOaxAQKUvNa1DwL666vYDAKnz4ybCAKDk9nCDzJNvNSRqJk4pCiIu2zleWIDw7lI',
             '__VIEWSTATE' : '/wEPDwUKMTYxNTkzNDU1N2Rk3FmaH8saVosQVEJP6/OWEyotBHk='
}

#需要给Post数据编码
postData = urllib.parse.urlencode(postData).encode('utf-8')

#通过urllib2提供的request方法来向指定Url发送我们构造的数据,并完成登录过程
request = urllib.request.Request(posturl, postData, headers)
print(request)
response = urllib.request.urlopen(request)
text = response.read()
print(text)

save_path="D:\\snatch2.txt" 
# save_path 's file unnecessary to be exist
f_obj = open(save_path,'wb')
f_obj.write(text)
print("snatch successfully.")

CSDN模拟登陆 但是没有成功 希望能得到指导

import urllib
import urllib.request
import http.cookiejar
import urllib.parse
import re

#登录的主页面
hosturl = 'http://passport.csdn.net' #自己填写
#post数据接收和处理的页面(我们要向这个页面发送我们构造的Post数据)
posturl = 'https://passport.csdn.net/account/login' #从数据包中分析出,处理post请求的url

#设置一个cookie处理器,它负责从服务器下载cookie到本地,并且在发送请求时带上本地的cookie
cj = http.cookiejar.LWPCookieJar()#创建一个CookieJar实例,用在存储和使用Cookie
cookie_support = urllib.request.HTTPCookieProcessor(cj)#用HTTPCookieProcessor处理获取的Cookie
opener = urllib.request.build_opener(cookie_support, urllib.request.HTTPHandler)#返回一个opener实例
urllib.request.install_opener(opener)#要打开一个url必须安装opener

#打开登录主页面(他的目的是从页面下载cookie,这样我们在再送post数据时就有cookie了,否则发送不成功)
h = urllib.request.urlopen(hosturl)

#正则
html = h.read()
LtRe = re.compile(b'name=\"lt\" value=\"(.*)\"')
Lt = re.findall(LtRe, html)
Lt = Lt[0]
executionRe = re.compile(b'name=\"execution\" value=\"(.*)\"')
exeRe = re.findall(executionRe, html)
exeRe = exeRe[0]
print(Lt)
print(exeRe)

#构造header,一般header至少要包含一下两项。这两项是从抓到的包里分析得出的。
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.3; WOW64; rv:32.0) Gecko/20100101 Firefox/32.0',
           'Referer' : 'https://passport.csdn.net/account/login'}

postData = {
             '_eventId' : 'submit',
             'execution' : exeRe,
             'lt' : Lt,
             'password' : '****',
             'username' : '****'
}
print(postData)

#需要给Post数据编码
postData = urllib.parse.urlencode(postData).encode('utf-8')

#通过urllib2提供的request方法来向指定Url发送我们构造的数据,并完成登录过程
request = urllib.request.Request(posturl, postData, headers)
print(request)
response = urllib.request.urlopen(request)
text = response.read()
print(text)

save_path="D:\\snatch2.txt" 
# save_path 's file unnecessary to be exist
f_obj = open(save_path,'wb')
f_obj.write(text)
print("snatch successfully.")


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值