python渲染html 库_使用Python将HTML渲染成纯文本

最新推荐文章于 2024-04-04 21:30:19 发布

蛋蛋科查尔

最新推荐文章于 2024-04-04 21:30:19 发布

阅读量1.2k

点赞数

文章标签： python渲染html 库

本文链接：https://blog.csdn.net/weixin_28744601/article/details/113672275

版权

我正在尝试用BeautifulSoup转换一大堆HTML文本。这里是一个例子：

Some text

more text

even more text

Some other text

我试着做一些像：

def parse_text(contents_string)

Newlines = re.compile(r'[\r\n]\s+')

bs = BeautifulSoup.BeautifulSoup(contents_string, convertEntities=BeautifulSoup.BeautifulSoup.HTML_ENTITIES)

txt = bs.getText('\n')

return Newlines.sub('\n', txt)

…但是我的span元素总是在新行上。这当然是一个简单的例子。有没有办法在HTML页面中获取文本，就像在浏览器中呈现的方式一样(不需要CSS规则，只是渲染div，span，li等元素的常规方式)在Python中？

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注