我使用HTMLParser从一个简单的html文本中提取一个图像url,如下所示:html =
some message I would like to preserve with its formatting
现在我还需要一个没有img标记的html版本,但是很难在正确的位置关闭标记。以下是我尝试的:
^{pr2}$
MyHtmlParser().feed(html)的输出如下:LATEST NEWS:
style=font-size: 17px;style=color: #993300;The image uploader works again, so make sure to use some screenshots in your uploads/tutorials to make your submission look extra nice
正如您所看到的(正如我的代码流所预期的那样),标记的关闭方式与原始html中的不同(例如span>;)。在
这可以用HTMLParser轻松完成吗?还是应该求助于RE来提取图像标记(这看起来不太优雅)?在
我不能使用外部模块来实现这一点,所以需要使用HTMLParser提供的功能。在
提前谢谢你,
弗兰克