BeautifulSoup的使用
下载第三方bs4库并引入BeautifulSoup
from bs4 import BeautifulSoup
获取BeautifulSoup对象
text=response.content.decode(‘utf-8’)
soup=BeautifulSoup(text,‘lxml’)
语法
find查找第一个
find_all查找所有[可切片]
中文文档链接
常见的四种对象
1.Tag:BeautifulSoup中的所有标签都是Tag类型,并且BeautifulSoup的对象Beautiful的对象其实本质上也是一个Tag类型,所有其实一些方法比如find、find_all()并不是BeautifulSoup的,而是Tag的。
2.NavigableString:继承自python中的str,用起来就跟使用python的str是一样的。
3.BeautifulSoup:继承自Tag,用来生成BeautifulSoup树的。对于一些查找方法,比如find,select这些,其实还是Tag的
4.Comment:继承NavigableString