python3汉字编码_Python3的编码总结

Python3编码结论:

Python3的字符串在内存中是用Unicode(占空间和带宽)保存的,所以不能直接用于存储,传输。要通过其它编码转换成相对应的字节码

str ----encode--->byte

byte----decode--->str

常见的编码

编码是美国最先发明的,最先出来的是ASCII编码,最早计算机在设计时采用8个比特(bit)作为一个字节(byte),所以一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节;

陆续大多国家都有自己的编码;

Unicode把所有语言统一在一套编码里,但Unicode是不可变长的编码,如果是纯英文的文章保存,占用的存储空间、传输带宽比ascii大一倍;

最终衍生出UTF-8可变长编码

1. ASCII编码:给英文字母,数字,标点,字符转换成计算机能识别的二进制数规定一个大家都认可的标准2

2. GBK编码:是汉字编码(含英文字母,数字,标点,字符部分)标准之一,是在 GB2312-80 标准 基础上的内码扩展规范,使用了双字节编码

3. Unicode编码:覆盖世界上所有字符的编码,最常用的是用 两个字节表示一个字符(如果要用到非常偏僻 的字符,就需要4个字节)

4. UTF-8编码:UTF-8兼容ascii,是可边长的字符串,节省空间和带宽

记事本存储-》读取

服务器 -》浏览器

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值