立即学习:https://edu.csdn.net/course/play/24756/280659?utm_source=blogtoedu
#--coding:utf-8-- from urllib import request url = 'http://piaofang.maoyan.com/dashboard' #没有构建请求头也成功了,与老师的案例https改成了http。原理不知道,是不是爬错了? #结果猫眼因为疫情停止实时票房,https也改成http,无法再从中爬取票房了。 resp = request.urlopen(url) print(resp.read().decode('utf-8'))#decode解码 #--------------------------------------------------- #课程注意项,如果要看票房,可以F12 点击NetWork 查看json文件,点击Response可以发现数据都在这里面。百度JS在线格式化工具,把这些数据复制黏贴上去,就直观可以看到了。然后查看Header改变我们构造的url,然后就可以获取实时票房,但是没有清洗数据。