scrapy关于.xpath中的normalize-space()的理解

最新推荐文章于 2022-04-15 18:10:57 发布

取一个好听的名字

最新推荐文章于 2022-04-15 18:10:57 发布

阅读量2.2k

点赞数 1

分类专栏： scrapy 文章标签： xpath normalize-space scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36821119/article/details/84454742

版权

scrapy 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

代码如下：

<div>a

        <p>b</p>

        <p>c</p>

</div>

若div为当前节点，使用.xpath('//div//text()').extract()开头或者结尾会有\r\n\t。

使用 .xpath('normalize-space(//div)').extract() 输出结果则是去掉了开头的\r\n\t

但是 .xpath('normalize-space(//div//text())').extract()是获取不到值的

因为text()返回的是节点集，normalize-space()无法标准化。可如果text()返回一个节点的时候，会自动转化为字符串。

取一个好听的名字

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
scrapy关于.xpath中的normalize-space()的理解

代码如下：&lt;div&gt;a &lt;p&gt;b&lt;/p&gt; &lt;p&gt;c&lt;/p&gt;&lt;/div&gt;若div为当前节点，使用.xpath('//div//text()').extract()开头或者结尾会有\r\n\t。使用 .xpath('normalize-space(//div)').extrac...
复制链接

扫一扫

专栏目录

取一个好听的名字 CSDN认证博客专家 CSDN认证企业博客

码龄8年

2: 原创

163万+: 周排名

166万+: 总排名

2396: 访问

: 等级

43: 积分

2: 粉丝

1: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

分类专栏

scrapy 1篇
web 1篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

animation实现弹弹框

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。