Python之HTMLParse

from html.parser import HTMLParser

class MyParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        print('start  <%s>' % tag)
        print("attrs", end="")
        if attrs:
            print(attrs[0][0])
    def handle_endtag(self, tag):
        print('end  </%s>' % tag)

    def handle_startendtag(self, tag, attrs):
        print('start end <%s/>' % tag)

    def handle_data(self, data):
        print("data   "+data)

    def handle_comment(self, data):
        print('<!--', data, '-->')

    def handle_entityref(self, name):
        print('sssss&%s;' % name)

    def handle_charref(self, name):
        print('eeeee&#%s;' % name)
parser = MyParser()
data = '''<html><head h='abcd'></head>wgwfew</html>'''
parser.feed(data)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值