一、计算机数据存储
计算机在存储数据的时候, 只能直接存储数字数据, 而且以二进制存储的数字。
位(bit)
1字节(byte) == 8位
1kb == 1024字节
1mb == 1024kb
1Gb == 1024mb
1T == 1024Gb
二、字符编码
字符编码
为了能够让计算机存储字符, 我们给每个字符关联一个具体的数字, 在需要存储字符的时候就存储字符对应的数字。
每个字符对应的数字就是字符的编码值。
编码表
每个字符和数字的一一对应关系的表就是字符编码表, 常用的字符编码表有两种: ASCII码表、Unicode编码表
-
ASCII码表:
采用1个字节对128个字符进行编码, 其中包括常用的英文符号、数字和字母。
其他数字的编码在字母的前面,大写字母的编码在小写字母的前面,大写字母和小写字母不连续 -
Unicode编码表:
叫万国码, 包括了世界上所有国家所有民族的所有语言的符号。前128个字符就是ASCII码表中的字符,
其中中文的编码范围是: 4e00~9fa5
编码字符
\u四位的16进制数 (这儿的4位的16进制数就是字母的编码值)
chr函数
chr(编码值) - 获取编码值对应的字符()
ord函数
ord(字符) - 获取字符的编码值
举例:
# 1.编码字符
str1 = 'a\u0061' # 0061是97的16进制数
print(str1)
print('\u4e00')
# 2.chr函数
print(chr(97))
# 3.ord函数
print(ord('a'), ord('佳'), ord('伟'))
运行结果:
aa
一
a
97 20339 20255