人人网页爬取

from http import cookiejar
import json
from urllib import request,parse
cookie_o = cookiejar.CookieJar()
header = request.HTTPCookieProcessor(cookie_o)
opener = request.build_opener(header)

url = 'http://www.renren.com/ajaxLogin/login?1=1&uniqueTimestamp=20187216111'

form = {
    'email': '18701334468',
    'icode': '',
    'origURL': 'http://www.renren.com/home',
    'domain': 'renren.com',
    'key_id': '1',
    'captcha_type': 'web_login',
    'password': '7d4520e0d16710e025a631b4befe0fa15db31a7ab8117a3e274308f0cc8e7025',
    'rkey': 'f0c0f9643f5839fb4c7885b963708900',
    'f': 'http%3A%2F%2Fwww.renren.com%2F967454034',
}
# 必须是字节
form_str = parse.urlencode(form).encode('utf-8')
response = opener.open(url,form_str)
html = response.read()
print(html)

res_dict = json.loads(html.decode('utf-8'))
print(res_dict)
mm = res_dict['homeUrl']
response = opener.open(mm)
html_bytes = response.read()
with open('renren.html','wb') as f:
    f.write(html_bytes)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值