python读取本地html文件并解析网页元素

最新推荐文章于 2024-04-25 10:21:17 发布

zy_whynot

最新推荐文章于 2024-04-25 10:21:17 发布

阅读量1.7w

点赞数 3

分类专栏： python

原文链接：https://www.jb51.net/article/140535.htm

版权

python 专栏收录该内容

31 篇文章 1 订阅

订阅专栏

BeautifulSoup4和 lxml 一样，Beautiful Soup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据。

with open('test.html', 'r', encoding='utf-8') as f:
 	Soup = BeautifulSoup(f.read(), 'html.parser')
 	titles = Soup.select('ul > li > div.article-info > h3 > a')
 	
for title in titles:
	 print(title.text)

BeautifulSoup详细教程
 BeautifulSoup使用案例

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zy_whynot

关注关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
python读取本地html文件并解析网页元素

BeautifulSoup4和 lxml 一样，Beautiful Soup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据。with open('test.html', 'r', encoding='utf-8') as f: Soup = BeautifulSoup(f.read(), 'html.parser') titles = Soup....
复制链接

扫一扫