1-7 bs4入门

xpath 模糊查询

//div[contais(@id," <...> ")]

取下一个节点(平级关系)

following-sibling::*

#bs4

用选择器查找

# 1.转类型
# 默认bs4会调用系统中lxml的解析库。所以会有较高提示,主动设置解析库
soup = BeautifulSoup(html_doc, features="lxml")

#格式化输出 补全
result = soup.prettify()
print(result)

#解析数据
# 用 "." 只能取第一个,
result = soup.head
result = soup.p

# 取文本
result = soup.a.string

#取属性
result = soup.a['href']

###四大对象:

Tag 标签对象

就对原生文本的类型

Navigablestring

string类型

bs4.BeautifulSoup

格式化文本的类型

comment

注释的内容是comment类型	

2.通运解析方法

find 取符合条件的第一个标签
# name
result = soup.find(name=“a”)
#attrs穿字典
result = soup.find(attrs={"": “”})
result = soup.find()

find_all 返回列表,全部的标签对象

result = soup.find_all('a')
result = soup.find_all('a',limit=1)

select_one 对应css的选择器,返回列表,类选择器:.标签,id选择器:#标签

result=select_one('.sister')

select css选择器,返回列表

result=select('.sister')

取内容 标签包裹的内容–列表

get_text()

取属性

get('<属性的名称>')

三种选择器对比

效率上正则最快

xml 前端移动端和后台交互的数据格式

.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值