unicode \u 编码字符与中文的互换

本文介绍了如何将中文汉字转换为Unicode编码字符,以及如何将自定义的Unicode编码字符转回中文汉字。通过案例展示了前16x16个汉字的Unicode编码,并提供了一个判断字符是否为中文的函数。
摘要由CSDN通过智能技术生成

本人电脑win10 64位系统, python版本3.7  若系统与版本不同,以下内容仅供参考

      本文章内容非unicode编码字符解码到中文,想看解码的请绕道!

.

.下面开始上内容:

      在汉字转拼音中,要用到unicode编码,用于区分各个汉字,取出汉字的四位编码,方便我们构建汉字拼音语音表

1.中文汉字转unicode编码字符,并取出该汉字的四位编码

hanzi="明"
str1=hanzi.encode("unicode_escape")#转字节字符
print(str1)#打印字节字符
bma=str(str1)[-5:][:4]#字节转字符并取出单个字的4位u编码

下面为精简版

hanzi="明"
str1=str(hanzi.encode("unicode_escape"))[-5:][:4]#取单字的4位u编码

.

.

2.自定义编码字符转中文汉字 

编码字符范围是:4e00 到 u9ff

无r的字符编码,可以直接print()打印出来,但这种字符编码不可修改变更。

用'\u'+'4e00'自定义组合编码有转义会报错,所以前面要加r。有r的字符编码是不能用print()打印出汉字的,要用专门的编码转换

案例:

<
  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值