Beautiful Soup_01

Spark_zzz

已于 2022-11-16 23:32:52 修改

阅读量81

点赞数

于 2022-11-16 23:22:42 首次发布

本文链接：https://blog.csdn.net/m0_60255954/article/details/127895581

版权

python

编写一段Beautiful Soup程序

from bs4 import BeautifulSoup
# 定义一段HTML
html="""
<html>
    <head><title>这是一个测试</title></head>
    <body>
        <a href='a.html'>第一页</a>
        <p>
        <a href='b.html'>第二页</a>
    </body>
</html>
    """
# 创建BeautifulSoup对象,并通过BeautifulSoup类得第2个参数指定lxml解析器
soup=BeautifulSoup(html,'lxml')
# 获取<title>便签的文本
print('<'+soup.title.string+'>')
# 获取第1个<a>标签的href属性值
print('['+soup.a["href"]+']')
# 以格式化后的格式输出这段HTML
print(soup.prettify())

运行结果: