# coding: utf-8
import io
from html.parser import HTMLParser
class MyHtmlStripper(HTMLParser):
def __init__(self, s):
super().__init__()
self.sio = io.StringIO()
self.feed(s)
def handle_starttag(self, tag, attrs):
pass
def handle_endtag(self, tag):
pass
def handle_data(self, data):
self.sio.write(data)
@property
def value(self):
return self.sio.getvalue()
s2 = """
<p>
非常长非常多的HTML文本
</p>
"""
print(MyHtmlStripper(s2).value)
Python3 中自动删除HTML文本中的Tag标识,保留纯文本
最新推荐文章于 2023-08-13 11:29:22 发布