from bs4 import BeautifulSoup
import re
html=requests.get('www.baidu.com')
soup=BeautifulSoup(html,'html.parser') ##构造实例
find_all() 查找多个
find() 查找一个
参数
name 查找匹配的标签名
soup.find_all('p') ##查找所有p标签的元素
soup.find_all(['p','div']) ##也可以查找列表中所有标签名
先匹配标签名,没找到再匹配属性
soup.find_all(id='username') ##查找id为username的元素
soup.find_all(_class='css') ##查找class为css的元素
attrs 属性
soup.find_all('p',attrs={'class':'css','id':'username'}) ##查找所有p标签,且class为css,id为username的元素
##string 内容
soup.find_all(string=re.compile('test')) ##查找所有内容中含有test的,返回的不是元素,直接返回匹配的内容
##limit ##限定返回的数量
soup.find_all('a',limit=2) ##查找所有a标签元素,只返回前两项
Beautifulsoup简单使用
最新推荐文章于 2023-06-25 17:39:46 发布