Python | scrapy框架 | 爬取2345影视最热电影排行榜

最新推荐文章于 2023-09-14 15:18:24 发布

过阵风

最新推荐文章于 2023-09-14 15:18:24 发布

阅读量543

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53527654/article/details/118438785

版权

本篇博客详细介绍了如何使用Scrapy爬虫框架抓取2345电影网站上的最热电影排行榜，包括电影名称、演员及简介等关键信息。首先创建Scrapy工程，然后定义爬虫程序，接着编辑items、spiders和pipelines文件，最后通过运行爬虫命令收集数据并存储为txt文件，整个过程清晰易懂。

摘要由CSDN通过智能技术生成

目标页面链接：http://dianying.2345.com/top/hot.html

爬取目标：获取最热电影排行榜10部电影的电影名，演员，简介

使用模块：Scrapy模块

一，创建工程

找一个文件夹，打开cmd进入该目录。
输入命令：
Scrapy startproject todayMovie

该目录下多了一个叫todayMovie的文件夹

二，创建爬虫程序

用cd先进入todayMovie目录，输入命令：
Scrapy genspider wuHanMovieSpider 2345.com

该命令创建了一个叫wuHanMovieSpider的爬虫
这时查看spiders目录可以看到多了一个wuHanMovieSpider.py，就是我们刚创建的爬虫。

三，编辑爬虫

用pycharm打开刚才创建的工程准备编辑爬虫

（1）编辑item.py

（2）编辑wuHanMovieSpider.py

（3）编辑pipelines.py

（4）修改settings.py(把这三行代码的注释符去掉）四，运行爬虫

在爬虫根目录执行命令：
Scrapy crawl wuHanMovieSpider

也可以直接在pycharm中运行

运行完毕可以看到多了个wuhan.txt

可以看到爬取成功

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python | scrapy框架 | 爬取2345影视最热电影排行榜

目标页面链接：http://dianying.2345.com/top/hot.html爬取目标：获取最热电影排行榜10部电影的电影名，演员，简介使用模块：Scrapy模块一，创建工程找一个文件夹，打开cmd进入该目录。输入命令：Scrapy startproject todayMovie该目录下多了一个叫todayMovie的文件夹二，创建爬虫程序用cd先进入todayMovie目录，输入命令：Scrapy genspider wuHanMovieSpider234.
复制链接

扫一扫

过阵风 CSDN认证博客专家 CSDN认证企业博客

码龄4年

1: 原创

146万+: 周排名

169万+: 总排名

542: 访问

: 等级

10: 积分

0: 粉丝

0: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

Python | scrapy框架 | 爬取2345影视最热电影排行榜 543

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。