BeautifulSoup有下列3个对象
- BeautifulSoup
- Tag
- NavigableString
BeautifulSoup对象的创建
创建一个BeautifulSoup对象是任何Beatutiful Soup工程的第一步。
BeatutifulSoup对象的创建可以通过一个字符串或一个类文件对象(可以是一个储存在本地的文件句柄或一个web网页句柄)
用字符串创建BeautifulSoup对象
向构造器中传递一个字符串创建对象,如:helloworld = "<p>Hello World</p>"
soup_string = BeautifulSoup(helloworld)
上述创建对象被当做HTML文档处理,可以使用print(soup_string)打印,输出为:
<p>hello world</p> (PS:输出结果与系统有关,有可能为<html><body><p>Helloworld</p></body></html>)
在创建对象过程中,输入被所支持的语法解析器转换为一个树结构体。所以,输入会被当做不同的BeautifulSoup对象(如BeautifulSoup,Tag,NavigableString).
用类文件对象创建BeautifulSoup对象
类文件对象在解析在线网页时非常

这篇博客详细介绍了BeautifulSoup库中的三个核心对象:BeautifulSoup、Tag和NavigableString。讲解了如何创建BeautifulSoup对象,包括使用字符串、类文件对象和XML解析器,并讨论了features参数的选择。同时,对Tag对象的属性、名字和获取方式进行了阐述,以及NavigableString对象在处理HTML或XML文档文本内容中的作用。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



