爬虫--人人网-简易爬取2

from yue.aaa.tuozhan_all import post, get
import json
from urllib import request,  parse


#导入包  ,保存cookie
from http import cookiejar
#通过对象保存cookie
cookie = cookiejar.CookieJar()
#handler 对应着一个操作
handler = request.HTTPCookieProcessor(cookie)
# opener 遇到有cookie的response的时候,调用handler内的一个函数 存储cookie到 objec中
opener = request.build_opener(handler)


# 1.url
url = 'http://www.renren.com/ajaxLogin/login?1=1&uniqueTimestamp=2018722359875'
# 2. form
form = {
    'email': '17600015762',
    'icode': '',
    'origURL': 'http://www.renren.com/home',
    'domain': 'renren.com',
    'key_id': '1',
    'captcha_type': 'web_login',
    'password': '000e2c3c99f8a73a61287bcaaa16d53f11dea4f308438ff687eb64c557a14962',
    'rkey': 'ccfaa6b14a7da2899fccd0a15cbd7b13',
    'f': '',
}
# 3.调用函数 post
form_bytes = parse.urlencode(form).encode('utf-8')
# response = request.urlopen(url,form_bytes)
# opener = response.build_opener()
# opener.open()
response = opener.open(url,form_bytes)
html_byte = response.read()
# html_byte = post(url,form = form)
#3 .打印结果
# print(html_byte)
res_dict = json.loads(html_byte.decode('utf-8'))
home_url = res_dict['homeUrl']

#访问页面
response = opener.open(home_url)
html_byte =response.read()
print(html_byte.decode('utf-8'))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值