Parsel是一个Python库,用于解析HTML和XML文档。它提供了一种简单的CSS选择器语法,用于从文档中提取数据。以下是Parsel的使用方法:
1. 安装Parsel
可以使用pip安装Parsel:
```
pip install parsel
```
2. 导入Parsel
在Python脚本中导入Parsel:
```python
from parsel import Selector
```
3. 创建Selector对象
使用Selector类创建一个Selector对象,传入要解析的HTML或XML文档:
```python
html = '<html><body><h1>Hello, World!</h1></body></html>'
selector = Selector(text=html)
```
4. 使用CSS选择器提取数据
使用CSS选择器语法从文档中提取数据。例如,从上面的HTML文档中提取标题:
```python
title = selector.css('h1::text').get()
print(title)
```
输出:
```
Hello, World!
```
5. 链式调