爬虫开发中免不了有定位难题和按钮点击拦截,我在本篇文章中总结问题,并给出目前我的解决方案。
目录
问题三:for循环的定位问题,不能顺利定位下一个大元素中的小元素
问题一:定位不稳定,时而有时而无
xpath的定位方式确实好用,但是定位字符串的编写也是门技术活。
解决方法:绝对路径、相对路径、树形、属性寻找等,这些的示例为:
# 树形文本结构寻找,绝对路径,最不稳定
articles = browser1.find_elements_by_xpath('/html/body/div[7]/div[3]/div/div/div/div/div/div[2]/div/div')
# 树形文本结构寻找,相对路径,较为稳定
name = article.find_element_by_xpath('./div/div[1]/span/div/span/a/span')
# 根据属性寻找(最稳定),绝对路径,找到整个页面中的第一个 # //div
articles = self.browser1.find_element_by_xpath('//div[@class="occludable-update ember-view"]')
#