爬取猫眼电影TOP100榜单

最新推荐文章于 2024-05-14 14:07:38 发布

是落霜啊

最新推荐文章于 2024-05-14 14:07:38 发布

阅读量2k

点赞数 2

文章标签： python 正则表达式

本文链接：https://blog.csdn.net/qq_19846909/article/details/108451369

版权

爬取猫眼电影Top100榜单

分析网页
内容提取

前提：会基础的python3以及requests库，正则等。

分析网页

top100榜单网址为https://maoyan.com/board/4，通过最简单浏览器自带的开发者工具（F12）抓包发现所需内容就在此网址。在这里插入图片描述
也可以直接请求这个网址，用python将返回数据保存下来，代码如下：最基础的爬虫
很简单，不过多叙述。

内容提取

我采用python自带的正则方法提取（方法有很多种），这是网页源代码内容，每个影片格式相同，接下来就可以写正则提取了。

<div class="board-item-content">
              <div class="movie-item-info">
        <p class="name"><a href="/films/13824" title="射雕英雄传之东成西就" data-act="boarditem-click" data-val="{movieId:13824}">射雕英雄传之东成西就</a></p>
        <p class="star">
                主演：张国荣,梁朝伟,张学友
        </p>
<p class="releasetime"

最低0.47元/天解锁文章

是落霜啊

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
爬取猫眼电影TOP100榜单

爬取猫眼电影Top100榜单分析网页内容提取前提：会基础的python3以及requests库，正则等。分析网页top100榜单网址为https://maoyan.com/board/4，通过最简单浏览器自带的开发者工具（F12）抓包发现所需内容就在此网址。也可以直接请求这个网址，用python将返回数据保存下来，代码如下：很简单，不过多叙述。内容提取我采用python自带的正则方法提取（方法有很多种），这是网页源代码内容，每个影片格式相同，接下来就可以写正则提取了。<div clas
复制链接

扫一扫