scrapy-基础

最新推荐文章于 2024-09-18 20:39:31 发布

weixin_30333885

最新推荐文章于 2024-09-18 20:39:31 发布

阅读量87

点赞数

文章标签： python 爬虫

原文链接：http://www.cnblogs.com/ldms/p/11469778.html

版权

一、创建一个项目

　　1、 pip3 install scrapy

　　2、scrapy startproject myspider

二、生成一个爬虫

　　3、scrapy genspider itcast itcast.cn scrapy genspider + 爬虫名字 + 爬虫范围。

三提取数据

　　5、完善 spider 使用 xpath等方法

四保存数据

　　pipeline中保存数据

五、启动 scrapy

scrapy crawl itcast ##### scrapy crawl+ 项目名字

ret1 = response.xpath("//div[@class='tea_con']//h3/text()")

print(ret1)

设置日志：

列表，列表中的每个元素是对象，每个对象是 selector 对象 selector 有个 xpath 有个 data

9、

ret1 = response.xpath("//div[@class='tea_con']//h3/text()").extract()

print(ret1)

KEY代表 piplines的位置，值代表距离引擎的远近

值距离引擎的远近，越小优先级越大。

posted on 2019-09-05 21:03 jason&li 阅读( ...) 评论( ...) 编辑收藏

转载于:https://www.cnblogs.com/ldms/p/11469778.html

weixin_30333885

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。