一、什么是字符串
字符串的类型名:str
字符串是容器型数据类型,将单引号和双引号作为容器的标志,元素不需要用逗号隔开
字符串是不可变的(不支持增删改)
字符串是有序的(支持下标操作)
二、字符串的元素
1)字符串中的元素要求
只能是文本符号(所有计算机能够表达出来的富豪都可以作为字符串的元素)
字符串中每一个独立的元素又叫字符,python中只有字符的概念,但没有字符对应的数据类型
注意:
空串的表示:'',"",'''''',""""""
2)字符(字符串中的元素)
字符串中的字符分为两种:普通字符 、转义字符
a.普通字符 除了转义字符以外的字符
b.转义字符 在指定符号前加\用来表示一些特殊功能和特殊意义的字符
\n (换行)
\t (制表符,相当于tab键)
\' (单引号)
\" (双引号)
\\ (反斜杠\)
\u四位的十六进制数 (编码字符)
str1='\u423ahello'
print(str1)
结果:
䈺hello
注意:计算字符串长度的时候,一个转义字符的长度为1
3)阻止转义 (r或者R)
在字符串的最前面加上r或者R,此时字符串中的转义字符都失效
str1=r'\u423ahello'
print(str1)
结果:
\u423ahello
应用1:windows路径
patt=r'c\tab\nan'
应用2:正则表达
三、字符编码
3.1 什么是字符编码
计算机在存储数据时,只能存储数字,存储的还是数字的补码
为了能够让计算机存储文本数据,给每一个字符关联了一个固定的数字,用来对这个字符进行存储。
3.2 编码表
1)ASCII码表
用一个字节来对字符进行编码(码值范围:0 ~ 127)
48 ~ 57 (0~9)对应的编码值
65 ~ 90 (A~Z)对应的编码值
97 ~ 122 (a~z)对应的编码值
2)Unicode编码表
Unicode编码表是对ASCII码表的扩展(Unicode编码表中包含了ASCII码表中的所有字符)
Unicode编码表中包含了世界中所有的国家所有的名族所有语言的符号,总共65535
中文范围:4e00 ~