学习笔记(07):150讲轻松搞定Python网络爬虫-urllib库-实战-猫眼票房

立即学习:https://edu.csdn.net/course/play/24756/280659?utm_source=blogtoedu

#--coding:utf-8--

from urllib import request

url = 'http://piaofang.maoyan.com/dashboard'
#没有构建请求头也成功了,与老师的案例https改成了http。原理不知道,是不是爬错了?
#结果猫眼因为疫情停止实时票房,https也改成http,无法再从中爬取票房了。
resp = request.urlopen(url)

print(resp.read().decode('utf-8'))#decode解码
#---------------------------------------------------
#课程注意项,如果要看票房,可以F12 点击NetWork 查看json文件,点击Response可以发现数据都在这里面。百度JS在线格式化工具,把这些数据复制黏贴上去,就直观可以看到了。然后查看Header改变我们构造的url,然后就可以获取实时票房,但是没有清洗数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值