爬取猫眼电影网前100的电影排名

最新推荐文章于 2024-06-25 17:49:47 发布

置顶

小熊提伯斯

最新推荐文章于 2024-06-25 17:49:47 发布

阅读量2.3k

点赞数 1

分类专栏： Python学习文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_30500113/article/details/83754874

版权

本文介绍了如何使用Python爬虫爬取猫眼电影网的前100部电影的排名、电影名称、主演、上映时间及评分。通过观察URL的变化规律构造出不同页面的链接，并详细说明了所需信息在网页中的位置，最终成功提取出数据并保存为JSON文件。

摘要由CSDN通过智能技术生成

爬取猫眼电影网前100的电影排名

猫眼电影网:http://maoyan.com/board/4
在这里插入图片描述

确定要爬取的数据：
1：排名
2：电影名称
3：主演
4：上映舌尖
5：评分

构造下一页url
首页:http://maoyan.com/board/4?offset=0
第二页 http://maoyan.com/board/4?offset=10
第十页 http://maoyan.com/board/4?offset=100
我们发现url中变化的只有数字那么我们可以通过循环构造出这个url

我们需要的信息全都在这些标签中:
在这里插入图片描述

用红色圈起来的地方就是我们需要的信息我们一个个找到他们然后将信息提取出来
在这里插入图片描述

#!/usr/bin/env python 
# -*- coding: utf-8 -*-
# @Time    : 2018/11/5 18:06
# @Desc    : 爬取猫眼电影网前100的电影排名
import requests
import json
from pyquery import PyQuery as pq

headers = {
   
    'proxy': 'https: 219.135.169.85:47315',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36'
                  ' (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'
}

最低0.47元/天解锁文章

小熊提伯斯

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
爬取猫眼电影网前100的电影排名

爬取猫眼电影网前100的电影排名猫眼电影网:http://maoyan.com/board/4确定要爬取的数据：1：排名2：电影名称3：主演4：上映舌尖5：评分构造下一页url首页:http://maoyan.com/board/4?offset=0第二页 http://maoyan.com/board/4?offset=10第十页 http://maoyan.com/bo...
复制链接

扫一扫

专栏目录