在学习爬虫的过程中,总会要用CSS选择器和Xpath选择器
在beautiful Soup和scrapy框架的时候,都要用到选择器。
有一种方法可以不用自己去写
就是在火狐浏览器和google浏览器的开发者工具里面。
选中标签后
右键
同一个标签下的浏览器
google浏览器
css
#main_results > div.default-container > h4:nth-child(1) > a
xpath
//*[@id="main_results"]/div[1]/h4[1]/a
火狐浏览器
css
.c-gap-bottom-small > a:nth-child(1)
xpath
/html/body/div/div[3]/div[1]/div[3]/div[2]/h3/a
这里面的selector和Xpath就是我们要的。
如果发现匹配不出来,可以试一试火狐浏览器的,我试过火狐浏览器的Xpath和google的不一样,火狐的匹配不成功,google匹配成功。