scrapy shell使用

最新推荐文章于 2022-12-09 18:49:31 发布

宸子涵

最新推荐文章于 2022-12-09 18:49:31 发布

阅读量737

点赞数

分类专栏： scrapy shell 脚本文章标签： python shell xpath

本文链接：https://blog.csdn.net/qq_47938951/article/details/118999081

版权

脚本同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

scrapy shell

1 篇文章 0 订阅

订阅专栏

scrapy shell基础使用

一、首先要有python、scrapy环境

二、使用scrpy shell：

打开cmd 进入scrapy安装目录下
scrapy shell 后面加需要测试的网址(要加英文下的双引号)
```
scrapy shell "http://www.farmer.com.cn/2021/07/22/99874851.html"
```
将直接进入操作环境

三、基础操作

输出响应数据
```
response.text  # 输出response数据 
```
输出body数据
```
response.body  # 输出body
```
输出headers数据
```
response.headers  # 输出headers
```

使用xpath

response.xpath("//div[@id='article_main']/*[not(name()='img')]//text()")  # 与scrapy正常使用xpath

案例：
response.xpath("//h1[@class='article-title']//text()").get()  # get()：获取结果列表的第一个数据(适合在结果列表只有一个的时候)

response.xpath("//div[@id='article_main']/*[not(name()='img')]//text()").getall()  # getall()：获取结果列表所有数据

打开当前测试网页

view(response)  # 打开一个网页，网页网址为测试网址

使用for

# 注意空格，空格为四个，结束多行，在尾部按两下回车键
for i in data:
	print(i.get())

退出scrapy shell
```
快捷键：ctrl + c
命令：exit()
```

宸子涵

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
scrapy shell使用

scrapy shell基础使用一、首先要有python、scrapy环境二、使用scrpy shell：打开cmd 进入scrapy安装目录下scrapy shell 后面加需要测试的网址(要加英文下的双引号)scrapy shell "http://www.farmer.com.cn/2021/07/22/99874851.html"将直接进入操作环境三、基础操作输出响应数据response.text # 输出response数据输出body数据r
复制链接

扫一扫