【HtmlParse】python3 ModuleNotFoundError: No module named 'htmlentitydefs'

最新推荐文章于 2024-04-23 13:33:53 发布

廿一说测试

最新推荐文章于 2024-04-23 13:33:53 发布

阅读量4.7k

点赞数

分类专栏：其他

本文链接：https://blog.csdn.net/gan_jia_v/article/details/85321365

版权

在尝试使用Python3解析HTML文件时遇到ModuleNotFoundError: No module named 'htmlentitydefs'的问题。经过查阅官网和Stack Overflow，发现该模块在Python3中已被弃用。通过调整导入方式，成功解决此问题。建议遇到类似问题时，首先查看官方文档，并尝试使用Google搜索更准确的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景：

需要解析html文件，获取需要的内容

语言：python

过程：

1.百度了一波，知道可以用HTMLParser这个库来做

2.坦白说，百度的各种写法不是很理解，因此直接查看了官网，链接附上：

https://docs.python.org/2/library/htmlparser.html

3.豁然开朗，开始写，导包、定义类、重写方法、调用·····然后就报错了，（贴上超简单的代码）

# -- coding: utf-8 --
from HTMLParser import HTMLParser

class MyParse(HTMLParser):
    def __init__(self):
        HTMLParser.__init__(self)

    def handle_starttag(self, tag, attrs):
        print("Encountered a start tag:", tag)

    def handle_data(self, data):
        pass

if __name__ == "__main__":
    parse = MyParse()
    content = ""
    with open("content.html", "r", encoding="utf-8") as htmlfile:
        content = htmlfi