介绍:
BeautifulSoup 是一个HTML/XML的解析器,主要的功能是如何解析和提取 HTML/XML 数据;
Beautiful Soup 会载入整个文档,解析整个DOM树。
安装:
安装Beautiful Soup 4 版本
安装命令:
pip install beautifulsoup4
首先发起一个get请求,得到一个response
response = requests.get(url,headers=headers)
打印response类型
print(type(response))
# <class 'requests.models.Response'>
是Response对象 ,Response对象里面有响应头(内容类型,内容长度,服务器信息,设置Cookie等;相应体(最重要的部分,包含请求资源的内容,如网页HTML,图片,二进制数据等);
获取响应体里最重要的部分使用 .content .text
———————————————————————————————————————————
response.content
打印它的类型
print(type(content))
#<class 'bytes'>
</