python采用哪种编码方式_python有哪几种编码方式

python编码方式有:1、ASCII;2、GB2312;3、Unicode;4、UTF-8。ASCII编码的制定是为了显示现代美国英语。为了解决信息交流的要求,可以使用GB2312编码来进行汉语交流。

be07b4638c444fabacb30cd0c018a3e2.png

编码方式:

(推荐教程:Python入门教程)

1、ASCII

众所周知,计算机是由美国人发明的,那么ASCII的制定也是由美国人完成的,因此ASCII的制定是为了显示现代美国英语。其中包括:

26个基本拉丁字母、阿拉伯数字和英式标点符号。

2、GB2312

ASCII只能解决美国人的信息交换需求,对于以汉字汉语为交流工具的中国人必须制定自己的编码方式,才能解决信息交流的要求。

GB2312就是这样一种编码方式,它是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》。

3、Unicode

世界上有200多个国家和地区,常用的语言文字也有几十种,各国都制定了自己的编码标准。例如日本:Shift_JIS,韩国:Euc-kr,各国有各国的标准,就会不可避免地出现冲突,结果就是,在多语言混合的文本中,显示出来会有乱码。

Unicode的产生就是为了解决这个问题的。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。

常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。现代操作系统和大多数编程语言都直接支持Unicode。

4、UTF-8

如果信息基本上全部是英文的话,用Unicode编码比ASCII编码需要多一倍的存储空间,在存储和传输上就十分不划算。 所以,为了节约空间,又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值