安装HTMLParser
修改他的源码
修改import markupbase为import _markupbase as markupbase (在源码的第11行)
修改return unichr(c)为return chr(c) python3中没有unichr,用chr即可(在源码的456行)
使用方法
from HTMLParser import HTMLParser
HTMLParser().unescape("《新编全注")