scrapy框架第一个实例

最新推荐文章于 2020-05-16 10:59:53 发布

weixin_43670105

最新推荐文章于 2020-05-16 10:59:53 发布

阅读量130

点赞数

文章标签： scrapy框架第一个实例

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43670105/article/details/88979250

版权

实例网页：https://python123.io/ws/demo.html
在这里插入图片描述
准备工作：在E盘中新建一个文件夹pyscrapyfile
步骤如下：
1.建立一个工程，工程名为python123demo
在命令行下进行E盘中的pyscrapyfile文件夹，输入命令

scrapy startproject python123demo

在这里插入图片描述

在这里插入图片描述

如上图，工程建立之后会出现这些文件与文件夹，下面简单介绍这些文件
python123demo/是最外层目录

scrapy.cfg 部署scrapy爬虫的配置文件
python123demo/文件夹scrapy框架的用户定义的python代码

init.py 初始化脚本不需要修改
items.py Items代码模板
middlewares.py middlewares代码模板
pipelines.py pipelines代码
settings.py 爬虫配置文件

spiders/ 模板目录
init.py 初始文件不需要修改
pycache.py 缓存目录，无需修改

第二步：产生一个爬虫

scrapy genspider demo python123.io

demo是爬虫名字，python123.io是要爬取的网站
在这里插入图片描述

在这里插入图片描述
demo爬虫产生在spiders文件夹下

第三步：配置产生的爬虫文件
allowed_domains 表示只能爬取该url下的文件
start_urls修改为爬取得网页链接

在这里插入图片描述
第四步：运行爬虫

scrapy crawl demo

在这里插入图片描述

爬虫爬取成功！！

weixin_43670105

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy框架第一个实例

实例网页：https://python123.io/ws/demo.html准备工作：在E盘中新建一个文件夹pyscrapyfile步骤如下：1.建立一个工程，工程名为python123demo在命令行下进行E盘中的pyscrapyfile文件夹，输入命令scrapy startproject python123demo如上图，工程建立之后会出现这些文件与文件夹，下面简单介绍...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。