Scrapy框架--创建项目

最新推荐文章于 2024-03-25 20:05:54 发布

yue_luo_

最新推荐文章于 2024-03-25 20:05:54 发布

阅读量232

点赞数

分类专栏： Python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yue_luo_/article/details/94918255

版权

Python 同时被 2 个专栏收录

16 篇文章 1 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

以下以豆瓣电影为例，在控制台中输入命令
1、创建工程
scrapy startproject 项目名

scrapy startproject movie

2、创建爬虫程序
进入项目文件，创建爬虫
可按以下命名创建
cd 项目名
scrapy genspider 爬取网站爬取网站一级域名（可保证爬虫不跳去目标网站）
系统自动创建爬取网站.py 的爬虫py文件

cd movie
scrapy genspider douban douban.com

3、自动创建目录及文件

4、在items.py设置数据存储模板

5、在douban.py编写爬虫

6、在settings.py设置配置文件

7、在pipelines.py编写数据处理脚本

8、执行爬虫
在movie目录下，scrapy crawl 爬虫名

scrapy crawl douban --nolog

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Scrapy框架--创建项目

以下以豆瓣电影为例，在控制台中输入命令1、创建工程scrapy startproject 项目名scrapy startproject movie2、创建爬虫程序进入项目文件，创建爬虫可按以下命名创建cd 项目名scrapy genspider 爬取网站爬取网站一级域名（可保证爬虫不跳去目标网站）系统自动创建爬取网站.py 的爬虫py文件cd moviescrapy ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。