Beautiful Soup 库的应用

BeautifulSoup库像煲汤,html解析遍历维护"标签树"html的功能库;from bs4 import BeautifulSoup

import requests
r=requests.get("http://python123.io/ws/demo.html")
r.text

demo=r.text
from bs4 import BeautifulSoup
soup=BeautifulSoup(demo,'html.parser')
print(soup.prettify())


 需要看那个页面,将需要的页面soup煲汤;soup=BeautifulSoup(需要修改的值,“html.parser”)

soup.title查看当前页面的标题

tag=soup.a ---->tag 查出所有a标签
soup.a.name=查看a标签的名字  a

soup.a.parent.name  'p’包含a标签的上层标签

soup.a.parent.parent.name 'body'  p的父亲时body

产看标签属性:tag.attrs

tag.attrs[‘href’]:查看标签具体类型

type(tag):查看标签类型

soup.a.string:查看a标签内容  简括号之间的内容

soup.p.string:查看p标签内容


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值