字符编码
字符编码:
计算机存储数据只能存数字(计算机只具备存储数字的能力)。
为了能够让计算机保存文字信息,就给每一个文本符号对应一个固定的数字,每次在需要存储这个文本符号的,就存储这个符号对应的数字。
这个数字就叫这个符号的编码值。
编码表 : 保存每个符号对应的编码值的表
ASCII码表
总共有128个字符对应的编码值,主要包含:常用的英文符号、数字字符、和字母
A - 65
a - 97
Unicode编码表(Python)
Unicode编码表中包含ASCII表
Unicode又叫统一码、万国码,它包含了世界上所有国家所有民族的所有语言的符号。
中文编码:4e00 ~ 9fa5
编码值的应用
chr(编码值) - 获取指定编码值对应的字符
print(chr(97)) # a
print(chr(0x4e00)) # 一
print(chr(0x9fa5))
ord(字符) - 获取指定字符对应的编码值(编码值以10进制的方式返回值)
注意:字符 - 长度为1的字符串
print(ord('a'), ord('A'))
print(ord('一'), ord('亿'))
print(hex(20313), hex(23159))
hex(数字) - 将数字表示成16进制数
print(hex(20323), hex(23359))
编码字符:在字符串中表示字符的方式有两种:直接提供字符,也可以提供一个编码字符。
str2 = '\u0061\u4e00\u9fa5'
print(str1, str2)
两个字符串比较大小比较的是第一对不相等的字符的编码值的大小
print('abc' > '一zzzzashf')
字符串的基本操作
查:字符串获取元素和列表获取元素的语法一模一样
message = 'hello python!'
print(message[0], message[-1], message[4])
print(message[1:-1:2])
print(message[1:4:-1])
print(message[2:])
for x in message:
print(x)
for index in range(len(message)):
print(index, message[index])
for index, item in enumerate(message):
print(index, item)
+、*运算符的应用
字符串1 + 字符串2 : 将两个字符串合并,产生一个新的字符串
字符串 * N :字符串重复N次产生一个新的字符串
str1 = 'abc'
str2 = 'hello'
result = str1 + str2
print(result) # 'abchello'
result = str1 * 3
print(result)
in 和 not in 函数的应用
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1
str2 = 'hello'
print('a' in str2) # False
print('h' in str2) # True
print('he' in str2) # True
print('hl' in str2) # False