Python3基础知识- 字符编码

本文介绍了Python3中字符编码的基础知识,包括默认的Unicode编码、ASCII、GB2312和UTF-8的区别。讨论了Python2和Python3在处理编码上的差异,以及为何会出现编码错误,还详细阐述了Python中编码转换的过程,特别是bytes类型在Python3中的作用。
摘要由CSDN通过智能技术生成

python解释器在加载.py文件中的代码时,会对内容进行编码

python默认字符编码
  • python 2.x默认的字符编码是ASCII,默认的文件编码也是ASCII。( 以utf-8 或者 gbk等编码的代码,加载到内存,并不会转为unicode,编码仍然是utf-8或者gbk等编码。)
  • python 3.x默认的字符编码是unicode,默认的文件编码是utf-8。( 以utf-8 或者 gbk等编码的代码,加载到内存,会自动转为unicode正常显示。)
编码方式

1.ASCII

现在我们面临了第一个问题:如何让人类语言,比如英文被计算机理解?我们以英文为例,英文中有英文字母(大小写)、标点符号、特殊符号。如果我们将这些字母与符号给予固定的编号,然后将这些编号转变为二进制,那么计算机明显就能够正确读取这些符号,同时通过这些编号,计算机也能够将二进制转化为编号对应的字符再显示给人类去阅读。由此产生了我们最熟知的ASCII码。ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。这样在大部分情况下,英文与二进制的转换就变得容易多了。
在这里插入图片描述

2.GB2312

虽然计算机是美国人发明的,但是全世界的人都在使用计算机。现在出现了另一个问题:如何让中文被计算机理解?这下麻烦了,中文

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值