选取相应的元素
soup.select(’.class’) ‘ . ’ + class 名 可以提取出class类同名的代码
soup.select(’#div’) ‘ # ’ + div名 可以提取出div类同名的代码
代码如下:
- 实例:
import requests #带入requests模块
from bs4 import BeautifulSoup #从bs4中带入requests模块
res = requests.get("https://news.sina.com.cn/gov/xlxw/2019-03-21/doc-ihsxncvh4391165.shtml")
#用get的方法获取新浪网到变量--res
res.encoding = 'utf-8' #因为显示中文会乱码,所以res.encoding = 'utf-8'以用utf-8的编码格式
soup = BeautifulSoup(res.text,"html.parser") #res.text是把得到的变量值转为文档
#"html.parser"是选取BeautifulSoup的解析方式
print(soup.select('.main-title')) #可以提出class类名为main-title的类容
- 在
soup.select('.class span a')
这表示在class
下的span
的a
下面