Python BeautifulSoup html解析

python BeautifulSoup html解析

import requests
from bs4 import BeautifulSoup
url=input("请输入:")
#http://python123.io/ws/demo.html
r=requests.get(url)
demo=r.text
#将r.text赋给demo
soup=BeautifulSoup(demo,"html.parser")
#用 html.parser解析器解析demo(即 r.text),赋给soup
print(soup.prettify())
#输出解析后的结果
print("\n\n\n\n\n")
print(soup.title)
#输出html的 <title>与</title>之中的内容
print("\n\n\n\n\n")
tag=soup.a
print(tag)
#获取(第一个)a标签(链接),并输出
print("\n\n\n\n\n")
print(soup.a.name)
#获取a标签的名字,并输出
print("\n\n\n\n\n")
print(soup.a.parent.name)
#获取a标签的父标签的名字,并输出
tag=soup.a
#获取a标签
print("\n\n")
print(tag.attrs)
#输出a标签的属性
print("\n\n")
print(tag.attrs['class'])
#输出a标签的属性中class属性的值
print("\n\n")
print(tag.attrs['href'])
#输出a标签的属性中href属性的值
print("\n\n")
print(type(tag.attrs))
#a.attrs(a的属性的类型)  结果为<class 'dict'>  (dict:字典)
print("\n\n")
print(type(tag))
print("\n\n")
print(soup.a)
#输出a标签的内容
print("\n\n")
print(soup.a.string)
#获取a标签中未用<>包含的部分
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值