Python爬虫-BeautifulSoup

Tag

标签及其内容:拿到它所找到的第一个内容

bs.title
bs.a
bs.head

NavigableString

标签里面的内容(字符串)

bs.title.string
bs.a.string
bs.head.string

如何获得标签的属性值?

bs.a.attrs

BeautifulSoup

表示整个文档

Comment

是一个特殊的NavigableString,输出的内容不包含注释符号

bs.a.string

文档的遍历

contents

获取Tag的所有子节点,返回一个list

bs.head.contents[1]

children

获取Tag的所有子节点,返回一个生成器

for child in bs.body.children:
	print(child)

文档的搜索

find_all()

字符串过滤:会查找与字符串完全匹配的内容

t_list=bs.find_all("a")
print(t_list)

正则表达式搜索

使用search()方法来匹配

## 标签里面含有a的都找出来
t_list=bs.find_all(re.compile("a))

函数方式搜索()

传入一个函数,根据函数的要求来搜索

def name_is_exists(tag):
	return tag.has_attr("name")

t_list=bs.find_all(name_is_exists)

kwargs-参数

t_list=bs.find_all(id='head')
t_list=bs.find_all(class_=True)

text 参数

t_list=bs.find_all(text="hao123")

limit 参数

t_list=bs.find_all("a",limit=3)

css选择器

t_list=bs.select("title")## 标签查找

t_list=bs.select(".mnav")## 类名查找

t_list=bs.select("#u1")  ## id查找

t_list=bs.select("a[class='bri']") ##属性查找

t_lisy=bs.select("head">"title") ##

t_list=bs.select(".mnav ~ .bri")
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值