文本编码解释

一张图解释字符集

在这里插入图片描述


举例说明什么是编码:

UTF-8编码
等长编码对于英文来说浪费空间,所以出现了变长编码UTF系列,如UTF8,UTF16,UTF32。
UTF8的编码对象是整个Unicode字符集,所以可以表示所有国家的语言而不会乱码,所以叫“万国码”。所以网络传输文本一般使用UTF-8编码,如网页,这样可以在不同的电脑上看到相同的文本而不乱码。

GB2312编码
但是UTF8还是对于英文来说,还是单个字节,但是对于其他语言编码还是多个字节,占用空间仍然较大。
如果只针对中文进行编码,被编码文字只有几万字,那么会节省很多空间。常用的简体中文编码有GBK/GB2312,GB表示国家标准。虽然节省的存储空间,但是前提是需要知道文本的语言是什么。所以只在中文环境下使用。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

撬动未来的支点

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值