文章目录
安装
pip install beautifulsoup4
卸载:
pip uninstall beautifulsoup4
## import
import requests
import os
from bs4 import BeautifulSoup
import bs4
import re
demo
r = requests.get("网址")
r.encoding = r.apparent_encoding
demo = r.text
soup = BeautifulSoup(demo, 'html.parser')
res = list()
for item in soup.find_all('a', string=re.compile('疫')):
res.append(item.string)
print(res)
上面可以简单的看作一段代码,大致意思就是在网页上寻找中含有“疫”的内容。
具体的用法会在后面给出。
Beautifulsoup操作
首先我们先明确html的基本结构
是很明显的树状结构。