[Python]利用Python进行网络爬虫

1. 前期准备:

需要用隐身窗口打开网页,因为若是之前登陆过此页面,那么再次登陆,就会直接读取本地的cookie数据,即用GET方法,此时无法获取得到POST方法传递的数据.

2. 利用浏览器解析数据

若是Chrome浏览器,可以直接利用F12打开开发者工具,获取POST方法传递的数据。具体数据如下图展示:

获取URL

 

3. 实现代码

 

import urllib.requestas request

importurllib.parse as parse

importurllib.error as error

importhttp.cookiejar

 

data = {}

data['username']= 'username'

data['password']= 'password'

data['lt']= 'XXXXX'

data['execution']= 'xxxxx'

data['_eventId']= 'submit'

 

 

url_values= parse.urlencode(data)

 

binary_data= url_values.encode('UTF-8')

url_path= 'url'

 

print("url:"+ url_values)

 

reponse =request.urlopen(url_path, data=binary_data)

 

print(reponse.read())

 

# htmlDat= getHtml(" http://bbs.csdn.net/callmewhy")

# htmlDat= getHtml("http://rrurl.cn/b1UZuP")

#print(htmlDat)

 

# getcookie data

# cookie=http.cookiejar.CookieJar()

# opener= request.build_opener(request.HTTPCookieProcessor(cookie))

#response = opener.open("http://www.baidu.com")

# foritem in cookie:

#     print('Name=' + item.name)

#     print('Value='+ item.value)

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值