下面分享一个使用Python进行网站模拟登陆的小例子。
原理
使用Cookie技术,绕开网站登录验证。要使用到cookielib库。流程:
- 创建一个保存Cookie的容器,可选的有
CookieJar,FileCookieJar,MozillaCookieJar,LWPCookieJar
.其相互之间的关系是CookieJar —-派生—->FileCookieJar —-派生—–>MozillaCookieJar和LWPCookieJar
. - 然后创建一个处理Cookie的处理器handler.通过
urllib2.HTTPCookieProcessor(cookie)即可
- 创建一个用于开启网站的opener。即可。这个opener相比于urllib2.urlopen方法更为普通一点而已。
opener = urllib2.build_opener(handler)
。 - 然后我们就可以正常的使用opener来访问网络了。
小案例
实现的功能是模拟登录到大连理工大学的教务网站。代码如下:
# coding:UTF-8import urllib,urllib2,cookielibfilename = r'F:\pachong\gaoqing\dlutcookie.txt'# show cookie and save to localcookie = cookielib.MozillaCookieJar()handler = urllib2.HTTPCookieProcessor(cookie)opener = urllib2.build_opener(handler)# 记得使用urllib模块进行参数的encodepostdata = urllib.urlencode({ # 哈哈,本宫不给你们我的账号╭(╯^╰)╮ 'zjh':'xxxxxxxxx', 'mm':'XXXXXX'})# 登陆到教务系统的urlurl = 'http://zhjw.dlut.edu.cn/loginAction.do'# 开始进行模拟登陆,并把cookie保存到变量response = opener.open(url,postdata)cookie.save(filename,ignore_discard=True,ignore_expires=True)# 打印一下获得的cookie信息吧for item in cookie: item.name + ' = ' + item.value# 利用cookie访问另一个网址 登陆到个人成绩的URLcourse_url='http://zhjw.dlut.edu.cn/xkAction.do?actionType=6'course_header={ 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2486.0 Safari/537.36 Edge/13.10586', 'referer':'http://zhjw.dlut.edu.cn/menu/s_main.jsp'}result = opener.open(course_url)print result.read()
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
运行结果
总结
其实对于模拟登陆而言,第一次的登陆就是为了获取那个cookie数据。然后通过我们创建的opener来完成接下来我们要进行的关键的进一步的操作。我们需要理解的就只是那个cookie的使用的流程就行了。
再分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow