xpath ,css

https://docs.scrapy.org/en/latest/intro/tutorial.html

xpath @选择属性  .当前目录下选择 //任意路径选择

/bookstore/book[position()<3],选取最前面的两个属于 bookstore 元素的子元素的 book 元素

 css span.text::text

 response.css("span.text").text().get() ///  AttributeError: 'SelectorList' object has no attribute 'text'

 

quote.css("span.text::text").get() 选择span下面text的text()标签内容

 

scrapy crawl quotes -o quotes.json 

 

That will generate an quotes.json file containing all scraped items, serialized in JSON.

 

For historic reasons, Scrapy appends to a given file instead of overwriting its contents. If you run this command twice without removing the file before the second time, you’ll end up with a broken JSON file.

 

转载于:https://www.cnblogs.com/bamboozone/p/10371485.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值