python爬虫-豆瓣喜剧电影评分top100的电影-小林月

数据展示:

排行榜向下滑动的时候发起一个请求

 查看请求方法,网址,以及返回形式

直接利用requests模块上代码

import requests
if __name__=="__main__":
    # 处理ucl携带的参数:封装到字典中
    #UA伪装为一个用户浏览器进行访问数据
    headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36'}
    url = 'https://movie.douban.com/j/chart/top_list'
    param = {
        "type": "24",
        "interval_id":"100:90",
        "action":"",
        "start": "0",#从第几部电影开始
        "limit": "100"#到第几部电影结束
    }
    # 对指定的url发起的请求对应的url是携带参数的..并且请求过程虫处理了参数
    response = requests.get(url=url,params=param,headers=headers)
    diany_json = response.json()

    #转换json文件为csv文件存储
    keys = list(diany_json[0].keys())
    # 这里输出类型转换前的类型和样子 供参考
    # 为了方便保存的时候方便进行索引,于是先获取json内map的key值
    list_json_data = []
    for i in range(100):
        list_json_data.append([diany_json[i][x] for x in keys])
    # 上面一行的代码等于 :
    # 1、
    # list_json_data.append([json_list[i][keys[0]], json_list[i][keys[1]], json_list[i][keys[2]]])
    # 2、
    # tmpList = []
    # for x in keys:
    #     tmpList.append(json_list[i][x])
    # list_json_data.append(tmpList)
with open('data.csv','w',encoding='utf-8-sig',newline='') as f:
	# 初始化 csv writer 对象
    import csv
    f = csv.writer(f)
    # 遍历json数据列表并保存每个列表
    for list_data in list_json_data:
        f.writerow(list_data)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值