python3默认的字符编码和文件编码_Python3高级—字符集和编码,进阶

1.Python默认字符和文件编码

(1).python3.x 默认的字符编码是Unicode,默认的文件编码是utf-8

(2).python2.x 默认的字符编码是ASCII,默认的文件编码是ASCII

2.Python字符串编码和解码

(1)默认字符串是Unicode类型,该类型字符串只能保存在内存中

(2)bytes类型字符串,可以保存在磁盘和网络间数据传输

(3)字符串从Unicode到bytes,需要编码:str.enconde("utf-8")

(4)字符串从bytes到Unicode,需要解码:str.decode("utf-8")

94cef63b837c8257b0cb338808cb5ce8.png

3.ord()函数和chr()函数

(1)ord()函数返回字符对应的ASCII数值或者Unicode数值

ca9ffec5d1453ddc02cc3171fb23a695.png

(2)chr()函数返回ASCII数值或者Unicode数值所对应的字符

706f1db3092237a20df0d292be45356e.png

4.chardet模块:检测其编码方式,然后转换为字符串

(1)pip install chardet

(2)ASCII码类型检测

724084348ff17916bcf50882d76692f1.png

(3)GBK类型编码检测

be180d8934f9f05fe1b5332cd8cf0a6d.png

5.对于乱码问题

(1)乱码的根源是编码和解码的方式不统一导致的

(2)解决乱码问题就是把编解码方式统一了

6.字符和编码的前世今生(不想了解的直接忽略)

(1)几个重要概念

位(bit)

计算机的最小单位,是二进制的其中一位(0/1)

字节(Byte)

计量存储容量的一种计量单位,1个字节=8个bit

字符

能看得到的文字与符号

字符集

字符的集合

编码

把字符转换成计算机可以识别的二进制代码(0/1)

解码

把二进制代码(0/1)转换为人眼可见的字符

(2)等我有时间再写。。。回家睡觉

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值