python3编码 字符_Python3 如何解码编码html中的&quot等字符

介绍Python3处理html文档中编码的字符(比如escape过的引号是&quot)的办法,如何解码和编码。

def3c219ce2c5b1b128d8e6f2b39131fcfec0eea.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

工具/原料

Python 3.6

方法/步骤

1

首先,如图是从html文档中截取的片段,可以看到其中有很多html转义编码的字符,比如引号变为&quot。

125ed0ecd3d96975e197962ad243040149fe09ea.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

2

要解码这种字符串,一种旧方法是import cgi,使用cgi的escape()函数,但是该方法现在已经废弃。

bf6e59704618dfdac168413589214f57925677ea.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

de9bfa3b3b8602216704e9e5d8bbf82065fb72ea.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

3

现在推荐的做法是使用html模块。首先import html,引用这个模块。

f9617afb960b31212a327e10dee983aee9d76dea.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

4

使用html的成员函数escape(),可以将一段正常带有符号的文本转义为html里的文本。

e996472ae3efe0782362a505b96c576698cf65ea.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

32a127723d03bbea78d54afbea43d7d4493154ea.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

5

使用html的unescape函数,可以将带有html转义的字符串还原为原来的字符串。

05aae8a75f0f822b3bbd6681c018512c8df14dea.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

END

注意事项

这是html转义序列,还有url转义%开头,unicode转义\u开头。

经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。

举报作者声明:本篇经验系本人依照真实经历原创,未经许可,谢绝转载。

展开阅读全部

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值