一、安装BeautifuSoup库
以管理员打开cmd输入:pip install BeautifuSoup4
二、BeautifuSoup库的理解
BeautifuSoup库是解析、遍历、维护”标签树“的功能库
import requests
from bs4 import BeautifulSoup
# 获取标签
r=requests.get("http://python123.io/ws/demo.html")
demo=r.text
soup=BeautifulSoup(demo,'html.parser')
print(soup.title) # title 网页的标题(左上方)
print(soup.a) # a 链接标签 如果有多个 则获取第一个
print(soup.a.name) # a标签的名字
print(soup.a.parent.name) # a标签父亲的名字 也就是包括a标签的上一层标签
print(soup.a.parent.parent.name) # 父亲的父亲
# 获取标签的属性
print(soup.a.attrs) # attrs:获取此标签下的所有属性
print(soup