python selenium网页表格、列表遍历方法

害怕记不住,存个在这里。
一、第一种网页表格结构(表格内容显示)
1、先看下图网页源码,根据源码分析网页结构:
https://img-blog.csdnimg.cn/b3d8c4c4f0e9452fae1d37b3151ffc77.png

2、经过分析后:
    需要先定位表格并获取
table=driver.find_element_by_xpath('/html/body/div[3]/table')#定位网页表格位置
    获取表格包含的行,并将行数赋值
table_rows=table.find_elements_by_tag_name('tr')# table包含行数的集合,包含标题
vrows=len(table_rows)#将总行数赋给变量
#table_cols=table_rows[0].find_elements_by_tag_name('th')# tabler的总列数
    遍历每行第2列(by_tag_name('td')[1])的值,也可以获取其他列只需要将[1]更改为需要获取的列即可。
for table_num in range(1, vrows):
    table_text=table_rows[table_num].find_elements_by_tag_name('td')[1].text#遍历每行第2列获取单元格的值。

二、第二种网页表格结构(下拉列表)

1、先看下图网页源码,根据源码分析网页结构:

 

 2、经过分析后:
#根据网页结构获取class=ant-select-dropdown-menu-item为需要获取的列表

dc_li = driver.find_elements_by_css_selector('.ant-select-dropdown-menu-item')

#获取列表长度即列表内元素个数(总行数)

zhs=len(dc_li)

for doc in range(1,zhs):#按行遍历文本

        bqnr=str(dc_li[doc].text)#将<li>标签的内容提取出来

        if jjys in bqnr:#判定标签内容是否包含变量jjys的字符

                ys=driver.find_element_by_xpath('/html/body/div[4]/div/div/div/ul/li[{}]'.format(doc-10)) # 根据网页结构doc-10为需要的jjys的XPATH路径

                sleep(0.1)

                ys.click()

这样就实现了对下拉列表中指定项的选择。

  • 6
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
以下是一个示例代码,可以使用 Selenium 获取嵌套网页表格,并将其传入一个列表中: ```python from selenium import webdriver # 初始化浏览器 browser = webdriver.Chrome() # 访问网页 browser.get('https://example.com') # 定位嵌套网页的 iframe 元素 iframe = browser.find_element_by_xpath('//iframe[@id="iframe_id"]') # 切换到 iframe 中 browser.switch_to.frame(iframe) # 定位表格元素 table = browser.find_element_by_xpath('//table[@id="table_id"]') # 初始化列表 table_data = [] # 遍历表格行 for row in table.find_elements_by_xpath('.//tr'): # 初始化行数据 row_data = [] # 遍历表格列 for cell in row.find_elements_by_xpath('.//td'): # 将列数据添加到行数据中 row_data.append(cell.text) # 将行数据添加到列表table_data.append(row_data) # 切换回主窗口 browser.switch_to.default_content() # 关闭浏览器 browser.quit() # 打印表格数据 print(table_data) ``` 说明: 1. 首先,需要初始化一个 Selenium 浏览器对象 `browser`(这里使用 Chrome 浏览器作为示例)。 2. 然后,使用 `browser.get()` 方法访问目标网页。 3. 接下来,需要定位嵌套网页的 iframe 元素,并使用 `browser.switch_to.frame()` 方法切换到 iframe 中。 4. 然后,使用 `browser.find_element_by_xpath()` 方法定位表格元素。 5. 初始化一个空列表 `table_data`,用于存储表格数据。 6. 遍历表格行,对于每一行,遍历表格列,将列数据添加到行数据中,然后将行数据添加到 `table_data` 列表中。 7. 遍历表格后,使用 `browser.switch_to.default_content()` 方法切换回主窗口。 8. 最后,关闭浏览器对象 `browser`,并打印表格数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值