BeautifulSoup 用法

一、标签选择器

1、子节点contents child(迭代器)

2、子孙节点 descendants(迭代器)

3、父节点 parent  

4、祖节点  parents

5、兄弟节点 next_siblings (下一个兄弟) previous_siblings(上一个兄弟)

二、标准选择器

1、find_all(name,attrs,recursive,text,**kwargs)

name

attrs        

text

 

2、find(name,attrs,recursive,text,**kwargs)

find返回单个元素,find_all返回所有元素

 

 

三、CSS选择器

通过select()直接传入css选择器就可以完成选择

 

获取属性

 

获取内容

 

总结

推荐使用lxml解析库,必要是使用html.parser

l 标签选择器筛选功能弱但是速度快

建议使用find(),find_all()查询匹配单个结果或者多个结果

如果对CSS选择器熟悉建议使用select

l 记住常用的获取属性和文本值得方法

转载于:https://www.cnblogs.com/zlel/p/8849069.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值