1.字符串编码
计算机其实是只认识0和1的,我们编写的代码,要让计算机认识,中间涉及到字符转换为数字0和1的过程,这个过程实际就是一个字符如何对应一个特定的数字的标准,这个标准就称之为字符编码
0/1 = 1bit
1byte = 8bit # 计算机的最小存储单位 0-255的数值
字符编码的发展史00000000
第一个阶段:
考虑英文ASCII(英文字符/键盘上的所有字符)
ASCII码用一个字节代表一个字符
第二个阶段:
各个国家纷纷定制了自己的字符编码
GBK使用两个字节(2bytes)代表一个字符 2**16-1 65535
第三个阶段:
unicode兼容万国语言 使用两个字节(2bytes)代表一个字符
第四个阶段:
utf-8:对英文字符1byte表示,中文3bytes
总结:
1.为了处理英文字符,产生了ASCII码
2.为了处理中文字符,产生了GBK
3.为了处理各国字符,产生了Unicode
4.为了提高存储和传输性能,产生了utf-8
重点:python3下字符编码使用情况
unicode:简单粗暴,所有字符都是2bytes,优点字符–》数字的转换速度快,缺点占用空间大
utf-8:精准,对不同的字符用不同的长度表示,优点:节省空间,缺点:字符–》数字的转换速度慢
python3中字符编码实际类型使用
1.内存中使用的就是unicode,用空间换时间
2.硬盘中或者网络传输用utf-8,尽可能节省带宽,保证数据传输的稳定性
编码(encode)和解码(decode)
编码(encode):将unicode转换为其他指定的编码
解码(decode):将原编码转换为unicode编码
2.赋值深浅复制
1.字符串(数字):在内存中是一次性创建的,不能直接修改,如需修改,需要重新创建
2.列表等可修改的数据类型:在内存中创建时是以链表的形式创建
3.字符串、数字:赋值、深浅拷贝都没有意义,因为其永远指向同一个内存地址
4.列表、元组、字典
3.bytes和bytearray(字符串,列表)
4.字符串格式化
如果想获取更多有关python的信息,和想玩python制作的小程序,可以关注微信公众号(dreamspy)。我们一起用python改变世界,一起用python创造梦想。