标题字符编码
字符编码的前世今身
1.字符集概述:
一套文字符号及其编码的描述。
2.几个基本概念:
❤位:计算机的最小单位 二进制中的一位, 用二进制的0/1表示。
❤字节:八位组成一个字节。
❤字符集:我们肉眼可见的文字与符号。
❤编码:将字符转换成计算机可识别的0/1代码。
❤解码:将计算机表示的0/1编码转换成肉眼可见的字符。
3.字符编码的起源;ASCII
4.字符编码的发展:百家争鸣
5.字符编码的现状:大一统的天下
Python中的字符编码:
☆☆☆解码方式和编码方式要相同,如果不同就会出现乱码,甚至于出现报错。
1.Python的字符串:
Python3的字符串默认支持多语言
对于单个字符的编码,Python提供了:(用的相对较少)
①.ord()函数获取字符的整数表示------- 一次只接受一个字符
②.chr()函数把编码转换为对应的字符----- 一次只接受一个字符,gbk是有范围的。
2.bytes和str
str:一个字符对应若干个字节。
如果要在网络上传输,或者保存到磁盘上,就需要把str变为以字节为单位的bytes。
①.以Unicode表示的str通过encode()方法可以编码为指定的bytes
②.从网络或磁盘上读取了字节流,读到的数据就是bytes,要把bytes变为str,就要用decode()方法
3.数据库查询操作
4.数据库更新操作
5.删除操作
print(ord('戏'))
print(ord('洗'))
print(ord('%'))
print(chr(25103))
print(chr(27927))
print(chr(37))
a = 'bc'
print(a.encode('ascii'))
b = '寻陈'
print(b.encode('gbk'))
print(b.encode('utf8'))
d = b'\xd1\xb0\xb3\xc2'
c = b'\xe5\xaf\xbb\xe9\x99\x88'
print(d.decode('gbk'))
print(c.decode('utf8'))
25103
27927
37
戏
洗
%
b'bc'
b'\xd1\xb0\xb3\xc2'
b'\xe5\xaf\xbb\xe9\x99\x88'
寻陈
寻陈