python extract_first_Python爬虫从入门到放弃（十四）之 Scrapy框架中选择器的用法

最新推荐文章于 2023-05-23 23:42:49 发布

weixin_39612228

最新推荐文章于 2023-05-23 23:42:49 发布

阅读量125

点赞数

文章标签： python extract_first

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39612228/article/details/111453223

版权

Scrapy提取数据有自己的一套机制，被称作选择器(selectors),通过特定的Xpath或者CSS表达式来选择HTML文件的某个部分

Xpath是专门在XML文件中选择节点的语言，也可以用在HTML上。

CSS是一门将HTML文档样式化语言，选择器由它定义，并与特定的HTML元素的样式相关联。

XPath选择器

常用的路径表达式，这里列举了一些常用的，XPath的功能非常强大，内含超过100个的内建函数。

下面为常用的方法

nodeName 选取此节点的所有节点/从根节点选取//从匹配选择的当前节点选择文档中的节点，不考虑它们的位置

. 选择当前节点

.. 选取当前节点的父节点

@ 选取属性*匹配任何元素节点

@*匹配任何属性节点

Node() 匹配任何类型的节点

CSS选择器

CSS层叠样式表，语法由两个主要部分组成：选择器，一条或多条声明

Selector {declaration1;declaration2;……}

下面为常用的使用方法

.class .color 选择class=”color”的所有元素#id #info 选择id=”info”的所有元素

* *选择所有元素

element p 选择所有的p元素

element,element div,p 选择所有div元素和所有p元素

element element div p 选择div标签内部的所有p元素

[attribute] [target] 选择带有targe属性的所有元素

[arrtibute=value] [target=_blank] 选择target=”_blank”的所有元素

选择器的使用例子

Example website

Name: My image 1

Name: My image 2

Name: My image 3

Name: My image 4

Name: My image 5

weixin_39612228

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python extract_first_Python爬虫从入门到放弃（十四）之 Scrapy框架中选择器的用法

Scrapy提取数据有自己的一套机制，被称作选择器(selectors),通过特定的Xpath或者CSS表达式来选择HTML文件的某个部分Xpath是专门在XML文件中选择节点的语言，也可以用在HTML上。CSS是一门将HTML文档样式化语言，选择器由它定义，并与特定的HTML元素的样式相关联。XPath选择器常用的路径表达式，这里列举了一些常用的，XPath的功能非常强大，内含超过100个的内建...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。