BeautifulSoup库的名字取自刘易斯·卡罗尔在《爱丽丝漫游仙境》里的同名诗歌。BeautifulSoup通过定位HTML标签来格式化和组织复杂的网络信息,用简单易用的python对象展现XML结构信息。
一、安装Beautifulsoup
1、windows平台
①安装pip(安装python3时选择安装)
②利用pip安装bs4——命令行模式:`pip install BeautifulSoup4
二、运行Beautifulsoup
解析本地网页
from bs4 import BeautifulSoup #bs4是BeautifulSoup4的简称
with open(r'E:\PycharmProjects\web_prase\new_index.html') as web_data:#利用open函数打开本地网页文件
soup=BeautifulSoup(web_data.read(),'lxml')#利用lxml解析网页