数据编码规则和文件读写

编码,

是从一种形式转换成另一种形式的过程。解码,是编码的逆过程
用预先规定的方法将数字,文本等信息转换成编码,或将信息,数据转换为规定的电脉冲信号。
二进制:用0 或1 表示,每个数字称为bit
从二进制的右边第一个数开始,每一个乘以2的n次方,n从0开始,每次递增1。然后得出来的每个数相加即是十进制数
例 10010
1X24+0x23+0x22+1x21+0x2**0=18
8个bit等于一个byte(字节)
bps=bite per second

  1. ACSLL编码:用七位或八位二级制编码来表示128或256中可能字符
    使用7位二进制(剩下的1位二进制位0)来表示所有的大写和小写字母,数字及标点符号。

2.GB(国标)编码:比较常用的是GB2312和GBK两种。GBK编码是对GB码的扩展,对多达两万多的简繁汉字进行了编码。

  1. unicode:将世界上所有文字都纳入其中,一个网页也可以显示多种语言,每个字符占两个字节,浪费 : UTF-8(8-bit
    Unicode Transformation Format),它是一种针对Unicode的可变长字符编码,它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。而且UTF-8还可以兼容ASCII编码。
  • Unicode是内存编码的规范,而UTF-8是如何保存和传输Unicode的手段
  • 2,8,16都是2的次方,方便相互转换
  • 8进制是用0,1,2,3,4,5,6,7;16进制是用0,1,2,3,4,5,6,7,8,9,a,b,c,d,e,f来表示。
  • python输入默认Unicode
    |encode| decode |
    |表示将Unicode转换成其他编程语言|例:name.encode(‘GB2312’)|
    | decode| 表示将其他编程语言转换为Unicode |

encode编码

print('西西'.encode('gbk'))
print('西西'.encode('utf-8')
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值