在python中根据UTF-8编码得到对应字符（串）的方式（如何往字符串里添加\x）

木漏れ日の中で

已于 2024-01-04 17:52:38 修改

阅读量463

点赞数 7

文章标签： python

于 2023-12-31 14:33:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/minglu1999/article/details/135315778

版权

如何凭借一个汉字的UTF-8编码，得到该汉字的字符串呢？
比如凭借E7BB98这一UTF-8编码得到汉字字符串"织".
首先，对一个汉字字符（串）进行.encode()，可得到一个以UTF-8（默认参数）编码的bytes类型。
在这里插入图片描述
可通过对bytes对象进行.decode()（默认UTF-8）来得到该汉字字符串。
虽然有raw_unicode_escape这样的参数可以在不改变字符串的内容的前提下按原样转换至bytes，从而得到我们想要的bytes

但Python的字符串里，\x应该是不能单独出现的。
在这里插入图片描述
对python似乎也不支持对bytes对象进行直接修改。
经过查阅资料，通过用到一个在binascii中叫做unhexlify的函数，可直接将UTF-8编码转换至我们想要的bytes对象。

原帖链接：https://www.daniweb.com/programming/software-development/threads/494123/how-can-i-add-add-x

另外一个方法：

utf8code = "e7bb87"
backslash_joined = "\\x".join([""]+[utf8code[idx:idx+2] for idx in range(0,6,2)])
character = backslash_joined.encode().decode('unicode_escape').encode("raw_unicode_escape").decode('utf-8')

在这里插入图片描述

木漏れ日の中で

关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
在python中根据UTF-8编码得到对应字符（串）的方式（如何往字符串里添加\x）

原帖链接：https://www.daniweb.com/programming/software-development/threads/494123/how-can-i-add-add-x。虽然有raw_unicode_escape这样的参数可以在不改变字符串的内容的前提下按原样转换至bytes，从而得到我们想要的bytes。首先，对一个汉字字符（串）进行.encode()，可得到一个以UTF-8（默认参数）编码的bytes类型。如何凭借一个汉字的UTF-8编码，得到该汉字的字符串呢？
复制链接

扫一扫

木漏れ日の中で CSDN认证博客专家 CSDN认证企业博客

码龄13年

10: 原创

45万+: 周排名

10万+: 总排名

2789: 访问

: 等级

145: 积分

35: 粉丝

42: 获赞

5: 评论

36: 收藏

私信

关注

热门文章

分类专栏

bug fixing 1篇

最新评论

记录一次自己使用OneDrive差点导致数据丢失的经历（个人之见，谨慎参考）
寒山独见君~: 可以做个本地文件夹到onedrive中文件夹映射的
CTW数据集的classification的benchmark的个人解读
CSDN-Ada助手: 恭喜你写了这篇关于CTW数据集分类benchmark的个人解读，看来你对这个领域有很深的理解。希望你能继续保持创作的热情，分享更多关于数据集分类benchmark的见解和经验。或许下一步你可以尝试写一些实际案例分析，或者和其他领域的专家进行交流，以便更全面地了解这一话题。期待你更多的精彩内容！
关于BCELoss为啥一直在0.69降不下去
CSDN-Ada助手: 恭喜！看到你写的第7篇博客，真的让人很高兴，持续创作是非常了不起的事情。关于BCELoss一直在0.69降不下去的问题，或许可以尝试调整学习率、批量大小或者尝试其他优化器，也可以尝试改变模型结构或者数据预处理方法，希望可以帮助到你。期待你的下一篇文章，加油！
尝试简明扼要解释下pytorch的torch.gather函数
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
在python中根据UTF-8编码得到对应字符（串）的方式（如何往字符串里添加\x）
CSDN-Ada助手: 恭喜你写了第5篇博客！标题很吸引人，我对你在Python中根据UTF-8编码得到对应字符（串）的方式非常感兴趣。你的博客内容对于初学者来说非常有帮助。不过，我想提一个建议，希望你在下一篇博客中能够更深入地探讨如何在字符串中添加\x。我相信你的进一步解释和示例会使读者更好地理解这个概念。继续努力，期待你的下一篇作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。