17-BeautifulSoup

兮知

已于 2022-08-13 15:38:14 修改

阅读量66

点赞数

分类专栏： python基础文章标签： python 开发语言

于 2022-08-13 15:36:54 首次发布

本文链接：https://blog.csdn.net/qq_44087994/article/details/126320416

版权

34 篇文章 1 订阅

订阅专栏

bs4（BeautifulSoup）是用来解析网页数据的第三方库，下载的时候用beautifulsoup4

使用的时候需要导入

from bs4 import BeautifuiSoup

使用流程：

通过css选择器or标签对象获取标签

soup.select(css选择器)--从整个网页中获取css选择器选中的所有标签，返回值是列表，列表中的元素是标签对象
soup.select_one(css选择器)--从整个网页中获取css选择器选中的第一个标签  返回值是标签对象

标签对象.select()--在指定的标签中获取css选择器选中的所有标签
标签对象.select_one()--在指定的标签中获取css选择器选中的第一个标签

然后获取标签中的内容或者属性

a）获取镖旗内容 --- 标签对象.text
b）获取标签属性 --- 标签对象.attrs['属性名']

示例如下：

from bs4 import  BeautifulSoup
from re import requests
html=requests.get(url).text
soup=BeautifulSoup(html,'lxml')
soup.select('')

关注

专栏目录