1. Beautiful Soup库入门
Beautiful Soup库是解析、遍历、维护“标签树”的功能库
Beautiful Soup库的引用:
Beautiful Soup库,也叫beautifulsoup4 或 bs4约定引用方式如下,即主要是用BeautifulSoup类
from bs4 import BeautifulSoup
import bs4
BeautifulSoup类:
BeautifulSoup对应一个HTML/XML文档的全部内容
Beautiful Soup库解析器:
soup = BeautifulSoup('<html>data</html>','html.parser')
BeautifulSoup类的基本元素 < p class = " title " > ... </p>
Tag 标签:任何存在于HTML语法中的标签都可以用soup.<tag>访问获得
当HTML文档中存在多个相同<tag>对应内容时,soup.<tag>返回第一个
每个<tag>都有自己的名字,通过<t