【Python爬虫实战项目】Python爬取Top100电影榜单数据并保存csv文件（附源码）

拾玖同学

已于 2024-06-21 13:35:35 修改

阅读量577

点赞数 12

文章标签： python 爬虫 pycharm

于 2024-06-21 13:35:06 首次发布

本文链接：https://blog.csdn.net/python1999319/article/details/139858813

版权

前言

今天给大家介绍的是Python爬取Top100电影榜单数据保存csv文件，在这里给需要的小伙伴们帮助，并且给出一点小心得。

电影top!

开发工具

Python版本： 3.6

相关模块：

requests模块

time模块

parsel模块

csv模块

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

文中完整代码及文件，需要的话可以
点击这里👉Python重磅福利：入门&进阶全套学习资料、电子书、软件包、项目源码等等免费分享！

思路分析

浏览器中打开我们要爬取的页面按F12进入开发者工具，查看我们想要的Top100电影榜单数据在哪里这里我们需要页面数据就可以了

页面数据

代码实现

for page in range(0, 101, 10):
    time.sleep(2)
    url = 'https://maoyan.com/board/4?offset={}'.format(page)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36',
        'Cookie': '__mta=20345351.1670903159717.1670903413872.1670903436333.5; uuid_n_v=v1; uuid=A8065B807A9811ED82C293D7E110319C9B09821067E1411AB6F4EC82889E1869; _csrf=916b8446658bd722f56f2c092eaae35ea3cd3689ef950542e202b39ddfe7c91e; Hm_lvt_703e94591e87be68cc8da0da7cbd0be2=1670903160; _lxsdk_cuid=1850996db5dc8-07670e36da28-26021151-1fa400-1850996db5d67; _lxsdk=A8065B807A9811ED82C293D7E110319C9B09821067E1411AB6F4EC82889E1869; __mta=213622443.1670903327420.1670903417327.1670903424017.4; Hm_lpvt_703e94591e87be68cc8da0da7cbd0be2=1670903436; _lxsdk_s=1850996db5e-8b2-284-88a%7C%7C18',
        'Host': 'www.maoyan.com',
        'Referer': 'https://www.maoyan.com/films/1200486'

    }
    response = requests.get(url, headers=headers)
    selector = parsel.Selector(response.text)
    li_s = selector.css('.board-wrapper dd')
    for li in li_s:
        name = li.css('.name a::text').get()
        star = li.css('.star::text').get()
        star_string = star.strip()
        releasetime = li.css('.releasetime::text').get()
        data_time = releasetime.strip()
        follow = li.css('.score i::text').getall()
        score = ''.join(follow)
        dit = {
            '电影名字': name,
            '主演': star_string,
            '上映时间': data_time,
            '评分': score,
        }
        csv_write.writerow(dit)
        print(dit)

Cookie获取

效果展示

总结

本篇介绍了主要使用 requests模块来请求数据，使用起来也是非常简单感兴趣的可以自己尝试一下。
在这里插入图片描述

拾玖同学

关注

12
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【Python爬虫实战项目】Python爬取Top100电影榜单数据并保存csv文件（附源码）

今天给大家介绍的是Python爬取Top100电影榜单数据保存csv文件，在这里给需要的小伙伴们帮助，并且给出一点小心得。本篇介绍了主要使用requests模块来请求数据，使用起来也是非常简单感兴趣的可以自己尝试一下。
复制链接

扫一扫