python解析html的库_用python解析html

最新推荐文章于 2023-11-22 16:00:00 发布

weixin_39633917

最新推荐文章于 2023-11-22 16:00:00 发布

阅读量1.4k

点赞数

文章标签： python解析html的库

python中，有三个库可以解析html文本，HTMLParser,sgmllib,htmllib。他们的实现方法不通，但功能差不多。这三个库中提供解析html的类都是基类，本身并不做具体的工作。他们在发现的元件后(如标签、注释、声名等)，会调用相应的函数，这些函数必须重载，因为基类中不作处理。

比如：

"""

Advice

The IETF admonishes:

Be strict in what you send.

"""

如果对这个数据做处理，当检测到标签时，对于HTMLParser，会调用handle_starttag函数。

下面具体介绍下几个库

1、HTMLParser

#------------------ HTMLParser_stack.py ------------------#

#-- coding: GBK --

import HTMLParser,sys,os,string

html = """

Advice

The IETF admonishes:

Be strict in what you send.

"""

tagstack = []

class ShowStructure(HTMLParser.HTMLParser):

def handle_starttag(self, tag, attrs): tagstack.append(tag)

最低0.47元/天解锁文章

weixin_39633917

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python解析html的库_用python解析html

python中，有三个库可以解析html文本，HTMLParser,sgmllib,htmllib。他们的实现方法不通，但功能差不多。这三个库中提供解析html的类都是基类，本身并不做具体的工作。他们在发现的元件后(如标签、注释、声名等)，会调用相应的函数，这些函数必须重载，因为基类中不作处理。比如："""AdviceThe IETF admonishes:Be strict in what ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。