python处理html字符实体& # 34 或& quot 格式

在 HTML 中 <>& 等字符有特殊含义(<,> 用于标签中,& 用于转义),他们不能在 HTML 代码中直接使用,如果要在网页中显示这些符号,就需要使用  HTML 源代码中使用字符实体。如需显示小于号,我们必须这样写:&lt; 或 &#60。(字符实体名称是 &lt;,实体编号&#60;)。浏览器渲染 HTML 页面时,会自动把字符实体串换成真实字符。

字符实体类似这样:

&entity_name;

或者

&#entity_number;

字符实体由三部分组成:

第一部分是一个 & 符号,第二部分是实体(Entity)名字,第三部分是一个分号。 比如,要显示小于号(<),就可以写&lt; 。

注意:实体名称对大小写敏感!使用实体名而不是数字的好处是,名称易于记忆。不过坏处是,浏览器也许并不支持所有实体名称(对实体数字的支持却很好)。

例如我们在html页面配置:

{
"xxId":"pingyi.huang"
}

前端直接传给后端,后端拿到的数据就是:

{
  &#34;xxId&#34;: &#34;pingyi.huang&#34;
}

Python可以通过html.unescape 反转义字符实体,将它转成真实数据

import html

data = '&#34;xxId&#34;: &#34;pingyi.huang&#34';
data = html.unescape(data)
print(data)

转义后数据

{
  "xxId": "pingyi.huang"
}

 Html 中常用的字符

&amp;&lt;&gt;&quot;&qpos;&copy;&reg;&trade;
&#38;&#60;&#62;&#34;&#39;&#169;&#174;&#8482;
&<>"'©®
 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值