问题演示
position_info_lst = driver.find_element_by_xpath('//div//h3//text()')
报错:
解决方法
方法1:使用 from lxml import etree
中的 xpath来进行解析
text = driver.page_source
html = etree.HTML(text)
position_info_lst = html.xpath('//h3/text()')
print(position_info_lst)
成功解析
方法2:使用 selenium 中针对 xpath 的 text
方法
position_info_lst = driver.find_element_by_xpath('//h3').text
print(position_info_lst)
可以看出,这两种方法最终都可以得到我们想要的 h3 标签中的文本,但是!区别是,如果使用 driver 的 xpath 解析,我们不能够得到全部标签中的文本,我们只能得到最开始的标签中的文本;所以这里要选用 etree.xpath 的方法来获得文本的列表