学习笔记(07):150讲轻松搞定Python网络爬虫-urllib库-实战-猫眼票房

最新推荐文章于 2024-11-08 13:43:44 发布

lin猦

最新推荐文章于 2024-11-08 13:43:44 发布

阅读量274

点赞数

分类专栏：研发管理文章标签： python 网络爬虫编程语言 Python 数据存储

本文链接：https://blog.csdn.net/qq_41573592/article/details/106382802

版权

研发管理专栏收录该内容

8 篇文章 0 订阅

订阅专栏

立即学习:https://edu.csdn.net/course/play/24756/280659?utm_source=blogtoedu

#--coding:utf-8--

from urllib import request

url = 'http://piaofang.maoyan.com/dashboard'
#没有构建请求头也成功了，与老师的案例https改成了http。原理不知道，是不是爬错了？
#结果猫眼因为疫情停止实时票房，https也改成http，无法再从中爬取票房了。
resp = request.urlopen(url)

print(resp.read().decode('utf-8'))#decode解码
#---------------------------------------------------
#课程注意项，如果要看票房，可以F12 点击NetWork 查看json文件，点击Response可以发现数据都在这里面。百度JS在线格式化工具，把这些数据复制黏贴上去，就直观可以看到了。然后查看Header改变我们构造的url，然后就可以获取实时票房，但是没有清洗数据。