教你用Python爬猫眼电影，简单网站却有 “多重思路” ！

爱摸鱼的菜鸟码农

于 2020-12-08 09:27:19 发布

阅读量731

点赞数

文章标签： python 大数据数据分析爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huang5333/article/details/110850085

版权

猫眼电影作为爬虫的必备练手网站，相信每个人都试过吧？那么这篇文章，我就再爬一次猫眼电影，而且用上正则和xpath一起，分别保存为excel表格和csv表格，（text文本这个就太简单了，自动忽略）, 所以这篇文章，虽然网站熟悉，但是内容上的干货确实不少。希望大家能学到一点东西！

爬虫思路：

本次爬取网站为： https://maoyan.com/board/4?offset=0
本次爬虫函数库：

这些函数库没有的话就自己下载一下，下载慢出现timeout的话，需要搭配一下国内镜像网站。百度一下清华镜像

本次爬虫代码思路：面向过程的简单操作
本次爬虫主要侧重于解析页面和保存数据二大模块，有需求可以直接跳转阅读。

分析页面：

拿到这个网站的第一步，就是分析页面，切不可着急，直接套用代码而上！

查看网页源代码之后，你可以找到页面中对应的数据，如图：

最低0.47元/天解锁文章

爱摸鱼的菜鸟码农

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
教你用Python爬猫眼电影，简单网站却有 “多重思路” ！

猫眼电影作为爬虫的必备练手网站，相信每个人都试过吧？那么这篇文章，我就再爬一次猫眼电影，而且用上正则和xpath一起，分别保存为excel表格和csv表格，（text文本这个就太简单了，自动忽略）, 所以这篇文章，虽然网站熟悉，但是内容上的干货确实不少。希望大家能学到一点东西！爬虫思路：本次爬取网站为： https://maoyan.com/board/4?offset=0 本次爬虫函数库：这些函数库没有的话就自己下载一下，下载慢出现timeout的话，需要搭配一下
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。