BeautifulSoup有下列3个对象
- BeautifulSoup
- Tag
- NavigableString
BeautifulSoup对象的创建
创建一个BeautifulSoup对象是任何Beatutiful Soup工程的第一步。
BeatutifulSoup对象的创建可以通过一个字符串或一个类文件对象(可以是一个储存在本地的文件句柄或一个web网页句柄)
用字符串创建BeautifulSoup对象
向构造器中传递一个字符串创建对象,如:helloworld = "<p>Hello World</p>"
soup_string = BeautifulSoup(helloworld)
上述创建对象被当做HTML文档处理,可以使用print(soup_string)打印,输出为:
<p>hello world</p> (PS:输出结果与系统有关,有可能为<html><body><p>Helloworld</p></body></html>)
在创建对象过程中,输入被所支持的语法解析器转换为一个树结构体。所以,输入会被当做不同的BeautifulSoup对象(如BeautifulSoup,Tag,NavigableString).
用类文件对象创建BeautifulSoup对象
类文件对象在解析在线网页时非常