Python爬虫爬取某网页电影排行实例

今天继续给大家介绍Python 爬虫相关知识,本文主要内容是Python爬虫爬取某网页电影排行实例。

一、目标站点分析

目标站点页面如下所示:
在这里插入图片描述
打开该页面后,简单查看可以发现,随着该页面不断下翻,电影相关数据不断出现,因此,我们可以猜测这个站点使用了Ajax请求。我们可以使用浏览器自带的工具来查看网页的数据包情况,如下所示:
在这里插入图片描述
从上图中可以看出,Ajax的数据包以GET的形式发出,其URL为:

https://movie.douban.com/j/chart/top_list?type=22&interval_id=100%3A90&action=&start=0&limit=20

可以简单分析结合实验得知,这里参数表示从start指定的参数开始,返回limit参数指定的电影信息。该数据包返回结果是一个json格式的数据,这个数据是一个列表,列表的每个元素是一个字典,在字典中包含了所有的电影信息。

二、实例代码编写

接下来,我们就可以编写代码了。编写好的代码如下所示:

import requests

url="https://movie.douban.com/j/chart/top_list"
get_param={
	"type":"22","interval_id":"100:90","action":"","start":"0","limit":"10"
}
UA={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"}
response=requests.get(url=url,params=get_param,headers=UA)
out_put=response.json()
for out in out_put:
    print(out["title"])

在上述代码中,大部分代码与简单Python爬虫编写——requests包使用初体验文章中的代码相同。唯一特别的一点是使用了reponse.json()函数,该函数可以返回响应数据包中的json格式的数据。在代码最后,打印了所有电影的title。
上述代码执行结果如下所示:
在这里插入图片描述
原创不易,转载请说明出处:https://blog.csdn.net/weixin_40228200

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

永远是少年啊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值