四大提取网页内容的基本方法之
4.css提取网页内容 语法简单一览
CSS选择器用于选择你想要的元素的样式的模式。
"CSS"列表示在CSS版本的属性定义(CSS1,CSS2,或对CSS3)。
在使用css之前需要把文本转换成一个对象
如:
from scrapy.selector import Selector
selector = Selector(text=html) #转换成一个对象
序号 | 选择器 | 示例 | 示例说明 | CSS |
---|---|---|---|---|
1 | .class | .intro | 选择所有class="intro"的元素 | 1 |
2 | #id | #firstname | 选择所有id="firstname"的元素 | 1 |
3 | * | * | 选择所有元素 | 2 |
4 | element | p | 选择所有< p >元素 | 1 |
5 | element,element | div,p | 选择所有< div >元素和< p >元素 | 1 |
6 | el |