BeautifulSoup的使用

1.find_all()
注意点:
1.返回的是列表
2.name用来指定需要匹配的tag
传入:字符串,正则,列表(查询多个标签)

# 获取所有的a标签
a=html_doc.find_all('a')
#获取以l开头的标签
print(html_doc.find_all(re.compile('^l')))
# 获取所有的img和a标签
imganda = html_doc.find_all(['img','a'])
#获取class为'easyCon'的标签
 html_doc.find_all(class_ = 'easyCon')

2. css选择器
(1)通过标签名

html_doc.select('img')

(2)类名

html_doc.select('.easyCon')

(3)id

html_doc.select('#noLogin')

(4)组合查找(在div标签中查找id=’noLogin’的内容)

html_doc.select('div #noLogin')

(5)按照属性查找

html_doc.select('li[id="noLogin"]')

(6)获取属性和文字部分

print('获取属性',a_obj.attrs['href'])
print('获取文字',a_obj.get_text())
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值