关于UTF-64格式的反思

目标

为了让不同语言表达相同意思,所需的编码长度差不多,有了UTF-64编码。

现实

可是,今天刚发现:虽然不同语言用UTF-8表达相同意思,编码长度差很多,但是,压缩之后就差不多了。代码如下:

'''
不同语言表达相同意思,需要的编码长度不同。
但压缩后就差不多了。
'''

import zlib

str1='''上午9:28,关于“不同语言表达相同意思,所需编码长度相同”的目标,似乎可以通过压缩软件来实现。在Python中试了试,压缩后的长度差不多。'''
str2='''At 9:28 am, it seems that the goal of "expressing the same meaning in different languages with the same encoding length" can be achieved through compression software. I tried it in Python and the compressed length is similar.'''
str3='''في 9 : 28 صباحا ، يبدو أن الهدف من " نفس المعنى في لغات مختلفة ، نفس طول الترميز " يمكن تحقيقه عن طريق ضغط البرامج . حاول في بيثون ، مضغوط طول ليست سيئة للغاية .'''
str4='''午前9時28分、「異なる言語が同じ意味を表し、必要な符号長が同じ」という目標は、圧縮ソフトウェアで実現できるようだ。Pythonで試してみましたが、圧縮後の長さの差はあまりありません。'''

data1=bytes(str1,'UTF-8')
data2=bytes(str2,'UTF-8')
data3=bytes(str3,'UTF-8')
data4=bytes(str4,'UTF-8')
c1=zlib.compress(data1,level=9)
c2=zlib.compress(data2,level=9)
c3=zlib.compress(data3,level=9)
c4=zlib.compress(data4,level=9)

print('汉语',len(data1),len(c1))
print('英语',len(data2),len(c2))
print('阿语',len(data3),len(c3))
print('日语',len(data4),len(c4))

运行结果:

/data/user/0/org.qpython.qpy/files/bin/qpython3.sh "/storage/emulated/0/Download/QPython/压 缩1.py" && exit
/ $ /data/user/0/org.qpython.qpy/files/bin/qpy
thon3.sh "/storage/emulated/0/Download/QPython
/压缩1.py" && exit
汉语 190 179
英语 225 158
阿语 277 177
日语 258 206

#[QPython] 按回车键退出 ...

反省

我浪费了许多时间,我所追求的,是一种在压缩状态下可以工作的字符编码,这很难,至少现在我觉得是浪费时间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值