BeautifulSoup
是一个可以从HTML或XML文件中提取数据的Python库。Beautiful Soup 已成为和 lxml、html5lib 一样出色的Python解释器,为用户灵活地提供不同的解析策略或强劲的速度。
-
Requests
- 获取html BeautifulSoup
- 解析html、xml,BeautifulSoup4库也称bs4库
安装BeautifulSoup4
-
anaconda安装
-
pip安装
pip install bs4 # 下载BeautifulSoup包
BeautifulSoup4实例
import requests
r = requests.request('get','http://baidu.com')
from bs4 import BeautifulSoup
soup=BeautifulSoup(r.text,'html.parser')
print(soup.prettify())