超简单爬虫示例（爬电影名称），一看就会

最新推荐文章于 2025-10-19 16:51:23 发布

原创最新推荐文章于 2025-10-19 16:51:23 发布 · 1.4k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#python #爬虫

笔记专栏收录该内容

31 篇文章

订阅专栏

本文介绍了如何使用Python的requests和re库爬取电影网站的数据。首先，通过设置User-Agent避免被网站屏蔽，然后从网络面板获取URL。利用正则表达式查找'movieName'后的电影名字，并遍历输出。爬虫初学者可以参考此教程进行实战练习。

import requests
import re

url="https://piaofang.maoyan.com/getBoxList?date=1&isSplit=true"
headers={'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1'}
#User-Agent 可以在网址中的后台查看，下面有解释
resp=requests.get(url,headers=headers)
#常规编码输出设置
resp.encoding='utf-8'
html=resp.text #得到的网址信息
print(html) #打印 输出结果如下图

html的输出

#接着上面的代码
infos=re.findall('"movieName":"(.*?)"',html)
for i in infos:
    print(i) #结果如下图

爬到的相关电影名称

超简单爬虫示例（爬电影名称），一看就会

相关解释