利用Scrapy爬取豆瓣电影TOP250榜单及影评

最新推荐文章于 2021-12-01 15:34:13 发布

夏天是小花儿

最新推荐文章于 2021-12-01 15:34:13 发布

阅读量2.5k

点赞数 3

分类专栏： Python 文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38915364/article/details/101109876

版权

本文介绍了如何利用Python的Scrapy框架爬取豆瓣电影TOP250榜单的信息，包括电影排名、名称、评分、评价人数和影评。通过解析网页HTML，设置爬虫项目，编写items、spiders、pipelines和settings文件，最终将爬取的数据保存为CSV文件。

摘要由CSDN通过智能技术生成

一：工具准备：

语言:python

安装scrapy包建议直接在Anaconda里安装，不易出错。其他安装方式，你懂得~

IDLE:Spyder（Anaconda带的编译器）

二：解析页面：

网址：https://movie.douban.com/top250

页面：

解析：笔者利用火狐浏览器的插件xPath Finder解析网页的源代码，易于查找HTML中元素的定位，在火狐浏览器的插件中即可下载。

定位到需要的爬取的元素。在本次爬取的过程中，需要爬取的元素有电影的排名、名字、得分、打分的人数和影评等。

三.建立工程文件

最低0.47元/天解锁文章

夏天是小花儿

关注

3
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。