【Python】Selenium爬虫提取属性值(href为例)

提取属性值

之前使用爬虫解析HTML一直使用的是bs4里面的BeautifulSoup,最近因为模拟登陆要使用Selenium,所以就直接使用Selenium解析HTML。解析HTML很重要的一步就是提取标签元素的属性。
这里展示一下使用提取hrtf的值:

div = driver.find_element_by_css_selector('#CSS_Selector')
href = div.get_attribute('href')

这样使用get_attribute()方法就可以提取元素的属性值了。

另外如果习惯使用BeautifulSoup方法,也可以,只需要使用

soup = BeautifulSoup(driver.page_source)

将其转成BeautifulSoup解析HTML即可。

我们下次再见,如果还有下次的话!!!
欢迎关注微信公众号:516数据工作室
516数据工作室

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值