查到相应的节点之后,关键在于如何找出该节点中的相关信息
1、 提取节点属性对应的值:
<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>
css:在这一条语句中,找到这个节点之后,我们知道,href,class,id都是这个节点的属性,如果rq=这个节点,那么rq[‘href’],rq[‘class’],rq[‘id’]分别可以得到链接、sister、link1.
<book id="b2">
xpath:找到该节点后,使用’/@id’+extract()提取出全部id的值,使用extract_first()提取出第一个值。如rq=这个节点,则rq.extract()为所有的id值。
2、 提取文本
<a href="http://example.com/elsie" class="sister" id="link1">Elsie</a>
css:rq=该节点,则rq.get_text()即可得到该节点的文本值,在这个节点中为Elsie。
xpath:找到该节点后rq=该节点,在路径中再加入’/text()’,再加上rq.extract()的使用即可得到文本值。
3、 查找某节点下的所有具有某种属性的节点
css:在节点后加[属性名=‘属性’],其中,属性名有则加,没有则不加。
查找所有具有属性class='sister’的节点。在css中,节点1+空格+节点2即代表该节1点下的所有节点2。
节点1+[属性名=‘属性’]表示节点1下所有具有该属性的节点。
xpath:节点1+//节点2表示节点1下所有的节点2,节点1+//节点2[@属性名=‘属性’]
表示节点1下具有该属性的所有节点2.