Python输出所有的Unicode字符!

最新推荐文章于 2024-08-07 22:32:38 发布

Wormwaker

最新推荐文章于 2024-08-07 22:32:38 发布

阅读量881

点赞数

文章标签： python Unicode 编码算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cjz2005/article/details/131919480

版权

该代码示例以chr函数为核心，创建一个名为Unicode_Entire.txt的文件，以UTF-8编码写入Unicode编码的字符，从0到205745，跳过了Unicode的HighSurrogateArea和LowSurrogateArea，因为这些区域的字符无法直接表示。尽管部分特殊字符无法正常显示，但成功输出了包括CJK扩展区在内的众多字符。

摘要由CSDN通过智能技术生成

代码一点点，主要就是用了chr函数：

f=open("Unicode_Entire.txt","w+",encoding="utf-8")
i=0
while i < 205745:
    f.write(chr(i))
    i+=1
    if i == 0xD800:
        i = 0xE000
f.close()

1.因为直接输出太慢，改为文件输出
2.D800~DFFF是High Surrogate Area和Low Surrogate Area，真打不出来（会报错），因此跳过

输出结果：
在这里插入图片描述

虽然有些字符不能正常显示，但整体效果不错，像上图这些CJK扩展区都能正常显示！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。