最近项目中需要用Scrapy写一个爬虫,用到了许多xpath和css选择器的语法,
因此在此做一个整合,基本的语法就不赘述了,只整理我遇到的比较复杂的语法,以便日后查询。
xpath语法:
1.选取某属性不包含某内容的节点
#选取class不包含"active"的节点
//*[@id='size_en']/div[not(contains(@class,"active"))]
2.选取id包含REVIEWS并且aria-hidden=”false”或没有aria-hidden属性的div节点
//div[contains(@id,"REVIEWS")and (@aria-hidden="false" or not(@aria-hidden))]
css选择器语法:
获取属性内容
#获取i标签style属性的内容
li>header>div>span>i>i::attr(style)
作者:疏花