Python+selenium使用xpath定位的七大方法,最后一个是模糊匹配,学网络爬虫的必知必会!

xpath定位的用法 ("//标签名[ @属性= "属性值"]")

 

转自:https://www.cnblogs.com/yoyoketang/p/6123938.html

在他这里学习到了好多,感谢~

一、xpath:属性定位    

 xpath : ("//标签名[ @属性= "属性值"]")
  1. xptah也可以通过元素的id、name、class这些属性定位,如下图

 

    2.于是可以用以下xpath方法定位

 

二、xpath:其它属性

    1.如果一个元素id、name、class属性都没有,这时候也可以通过其它属性定位到


三、xpath:标签

    1.有时候同一个属性,同名的比较多,这时候可以通过标签筛选下,定位更准一点

    2.如果不想制定标签名称,可以用*号表示任意标签

    3.如果想制定具体某个标签,就可以直接写标签名称

 

四、xpath:层级

    1.如果一个元素,它的属性不是很明显,无法直接定位到,这时候我们可以先找它老爸(父元素)

    2.找到它老爸后,再找下个层级就能定位到了

    3.如上图所示,要定位的是input这个标签,它的老爸的id=s_kw_wrap.

    4.要是它老爸的属性也不是很明显,就找它爷爷id=form

    5.于是就可以通过层级关系定位到

 

五、xpath:索引

    ​1.如果一个元素它的兄弟元素跟它的标签一样,这时候无法通过层级定位到。因为都是一个父亲生的,多胞胎兄弟。

    ​2.虽然双胞胎兄弟很难识别,但是出生是有先后的,于是可以通过它在家里的排行老几定位到。

    ​3.如下图三胞胎兄弟

 

    ​4.用xpath定位老大、老二和老三(这里索引是从1开始算起的,跟Python的索引不一样)

 

六、xpath:逻辑运算

    ​1.xpath还有一个比较强的功能,是可以多个属性逻辑运算的,可以支持与(and)、或(or)、非(not)

    ​2.一般用的比较多的是and运算,同时满足两个属性

 

 

七、xpath:模糊匹配

    ​1.xpath还有一个非常强大的功能,模糊匹配

    ​2.掌握了模糊匹配功能,基本上没有定位不到的

    ​3.比如我要定位百度页面的超链接“hao123”,在上一篇中讲过可以通过by_link,也可以通过by_partial_link,模糊匹配定位到。当然xpath也可以有同样的功能,并且更为强大。

 

分类: ui自动化

使用 PythonSelenium 库进行元素定位时,可以创建一个类来管理定位相关的操作。下面是一个示例代码: ```python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC class ElementLocator: def __init__(self, driver): self.driver = driver def find_element_by_id(self, element_id): return self.driver.find_element(By.ID, element_id) def find_element_by_xpath(self, xpath): return self.driver.find_element(By.XPATH, xpath) def wait_for_element_visible(self, locator, timeout=10): return WebDriverWait(self.driver, timeout).until(EC.visibility_of_element_located(locator)) # 可以添加其他常用的元素定位方法,比如 find_element_by_css_selector、find_element_by_class_name 等等 # 示例用法 driver = webdriver.Chrome() element_locator = ElementLocator(driver) element = element_locator.find_element_by_id("element_id") element.click() visible_element = element_locator.wait_for_element_visible((By.XPATH, "//div[@class='my-element']")) ``` 在上面的示例代码中,我们创建了一个名为 `ElementLocator` 的类,它接收一个 Selenium WebDriver 对象作为参数,并提供了一些常用的元素定位方法,比如 `find_element_by_id` 和 `find_element_by_xpath`。此外,还添加了一个 `wait_for_element_visible` 方法,用于等待元素可见。 你可以根据自己的需要扩展 `ElementLocator` 类,添加其他常用的元素定位方法,以便于在测试或爬虫等场景中使用
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值