python 爬虫学习入门 数据分析BeautufulSoup4 简
BeautifulSoup4
BeautifulSoup4 和lxml 的提取方法有相似之处, 都是通过标签来对内容进行分析,
用beautifulSoup4 对其进行分析的步骤有以下几点:
由于BeautifulSoup4 不能处理字符串类型的文本信息,因此需要对字符串类型的html文本进行转化,转换成html 类型的html 文档
第一步, 文档类型转换
from bs4 import BeautifulSoup
# 通过爬虫获取到的html 文档,是字符串类型
html = "我是字符串类型的ht
原创
2021-01-28 09:40:38 ·
199 阅读 ·
0 评论