HTML标签的get方法

1. 获取标签属性的时候,可以先获取整个标签,再利用get()方法获取标签的属性

import requests
from lxml import etree
html=requests.get('https://www.w3cschool.cn/').text
html=etree.HTML(html)
res=html.xpath('//li//a')    #获得li标签
for re in res:
    print(re.get('href'))  #get()方法获得各li标签的href属性    

这样写的好处是:如果一次需要提取多个属性的时候,多次提取的时候比较方便。

当get()获取的标签属性在标签中并不存的时候,返回None,并不抛出异常。这还挺好的。。

etree.tostring(标签)函数:打印每个标签的具体内容

html = etree.HTML(res)
result = etree.tostring(html)

2.在selenium webdriver 中,

from selenium import webdriver

driver=webdriver.Chrome()

driver.get('https://music.163.com/')

driver.switch_to_frame('contentFrame')

htmllist=driver.find_elements_by_xpath('//p[@class="dec"]//a')

songlist_list=[]
songlist_list_name=[]

for item in htmllist:
    songlist_list.insert(0,item.get_attribute('href'))  #用get_attribute获取标签属性
    songlist_list_name.insert(0,item.get_attribute('textContent').strip())  #获取标签的文本
内容

在selenium webdriver 中获取标签的属性需要get_attribute()函数来获取,不可再用get()方法了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值