1.find_all()
注意点:
1.返回的是列表
2.name用来指定需要匹配的tag
传入:字符串,正则,列表(查询多个标签)
# 获取所有的a标签
a=html_doc.find_all('a')
#获取以l开头的标签
print(html_doc.find_all(re.compile('^l')))
# 获取所有的img和a标签
imganda = html_doc.find_all(['img','a'])
#获取class为'easyCon'的标签
html_doc.find_all(class_ = 'easyCon')
2. css选择器
(1)通过标签名
html_doc.select('img')
(2)类名
html_doc.select('.easyCon')
(3)id
html_doc.select('#noLogin')
(4)组合查找(在div标签中查找id=’noLogin’的内容)
html_doc.select('div #noLogin')
(5)按照属性查找
html_doc.select('li[id="noLogin"]')
(6)获取属性和文字部分
print('获取属性',a_obj.attrs['href'])
print('获取文字',a_obj.get_text())