bs4的学习

soup = BeautifulSoup(html,'html.parser') #'html.parser'是html解析器必须有


soup.find_all("a")  #等价于 soup("a")
soup.find("a") #等价于 soup.a


soup.p  得到的是文档中的第一个p标签
soup.find_all要想得到所有标签p标签

print soup.p.get_text()生成一个文本,只是第一个标签

用css查找
print soup.find_all("a", class_="sister") #注意写法的形式
查找结果<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>


学习网址http://wiki.jikexueyuan.com/project/python-crawler-guide/beautiful-soup.html



转载于:https://www.cnblogs.com/ZHANG576433951/p/6118629.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值