html中img在线提取,HTMLParser只提取img标记

我使用HTMLParser从一个简单的html文本中提取一个图像url,如下所示:html =

announcementssome message I would like to preserve with its formatting

现在我还需要一个没有img标记的html版本,但是很难在正确的位置关闭标记。以下是我尝试的:

^{pr2}$

MyHtmlParser().feed(html)的输出如下:LATEST NEWS:

style=font-size: 17px;style=color: #993300;The image uploader works again, so make sure to use some screenshots in your uploads/tutorials to make your submission look extra nice

正如您所看到的(正如我的代码流所预期的那样),标记的关闭方式与原始html中的不同(例如span>)。在

这可以用HTMLParser轻松完成吗?还是应该求助于RE来提取图像标记(这看起来不太优雅)?在

我不能使用外部模块来实现这一点,所以需要使用HTMLParser提供的功能。在

提前谢谢你,

弗兰克

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值