【Python 学习_第3周_字符编码】金角大王培训_第三周_字符编解码_心得及网上资料连接...

一、计算机编码简介

编码是指示将信息从表示方法A转变为表示方法B,解码是编码的逆过程,信息通过编解码后,信息内容不变。

针对计算机而言,编码就是将信息转为计算机可以识别的二进制0、1数字,而由于各国表示信息的方式不一致(如中文:汽车;美国: bus),因此各国产生了自己的编码规则,比较常用的是

ASCII码:早期计算机编码,在内存占用1个字节(8bit),因此最多能表示256个符号,表示为英文字母和特殊符号。

GBK编码:随着计算机在中国应用,国内编码经历gb2312 – gbk的演变,现应用较多的是GBK编码。GBK占2个字节。

Unicode编码:由于各国采用自己的编码格式,标准组织制定了Unicode编码,兼容各种编码方式,因此又称万国码,占有2个字节。

UTF-8编码:ASCII仅仅占用一个字节,而unicode编码同一为2个字节,为了节省存储空间,提高信息传输速度,产生utf-8编码,又称变字长编码,其中ASCII占1个字节,汉字占3个字节。

注意:文件在硬盘存储的数据是通过某种编码方式编码的bytes字节串,在内存中的数据都是unicode。

二、Python编码转换语句

编解码间转换图

 

 

从utf-8 转成 GBK Python3.x实现代码

Utf8_to_gbk = 变量名.decode(‘utf-8’).encode(‘gbk’)

gbk_to_utf8= 变量名.decode(‘gbk’).encode(‘utf-8’)

三、网上资料

 博客园中发现将的比较好的链接 https://www.cnblogs.com/yuanchenqi/articles/5956943.html

转载于:https://www.cnblogs.com/Finding-bugs/p/9246539.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值