Python基础之编码问题

起因:计算机只能处理数字,如果要处理文本,就要把文本转换成数字。一个字节(byte)是8(bit),要处理中文的话至少需要两个字节并且要避免与ASC11编码表冲突,因此出现了GB2312编码专门为中文编码。多国有各自的编码,那么在多语言的混合文本里会显示乱码,于是Unicode标准便出现了。

ASCII与Unicode区别:ASCII编码是1个字节,而Unicode编码通常是2个字节。如果把ASCII编码的A用Unicode编码,只需要在前面补0就可以。

UTF-8(可变长编码)的出现:如果很少涉及中文等多字节,那么使用unicode将会非常浪费存储空间。只支持ASCII编码的一般可以在UTF-8下继续正常使用。

在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值