Python输出所有的Unicode字符!

该代码示例以chr函数为核心,创建一个名为Unicode_Entire.txt的文件,以UTF-8编码写入Unicode编码的字符,从0到205745,跳过了Unicode的HighSurrogateArea和LowSurrogateArea,因为这些区域的字符无法直接表示。尽管部分特殊字符无法正常显示,但成功输出了包括CJK扩展区在内的众多字符。
摘要由CSDN通过智能技术生成

代码一点点,主要就是用了chr函数:

f=open("Unicode_Entire.txt","w+",encoding="utf-8")
i=0
while i < 205745:
    f.write(chr(i))
    i+=1
    if i == 0xD800:
        i = 0xE000
f.close()

1.因为直接输出太慢,改为文件输出
2.D800~DFFF是High Surrogate Area和Low Surrogate Area,真打不出来(会报错),因此跳过

输出结果:
在这里插入图片描述
在这里插入图片描述

虽然有些字符不能正常显示,但整体效果不错,像上图这些CJK扩展区都能正常显示!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值