一、字符串定义
字符串是容器型数据类型,将单引号或者双引号作为容器的标志,元素不需要用用逗号隔开:‘元素1元素2…’
字符串是不可变的(不支持增删改);字符串是有序的
字符串中的元素:只能是文本符号(所有计算机能表达出来的符号,一个符号对应一个元素)
字符串中每一位独立的元素又叫:字符;python中只有字符的概念,但是没有字符对应的数据类型
1、字符
字符串中分为普通字符、特殊字符(转义字符)两种。
除了转义字符都是普通字符。
转义字符:在指定符号前加入\用来表示一些特殊功能和特殊意义的字符
\n - 换行
\t - 制表符(按tab键)
\’ - 单引号
\" - 双引号
\\ - 反斜杠
编码字符:\u4位的16进制数
例:
str1 = '\tabc\n123'
print(str1)
str2 = 'abc\'12\"3'
str2 = 'abc\\n123'
str5 = '\u4e00你好!\u7812'
print(str5)
注: 计算字符串的长度的时候,一个转义字符的长度是1
阻止转义:
就是在字符串的最前面加r/R,那么这个字符串中的所有转义字符都无效。
例:
str6= r'\tabc\n123\u7812'
print(str6)
# 应用1:windows路径
path = r'C:\nan\temp'
print(path)
二、字符编码
计算机在储存数据的时候只能存数字,而且存的是数字的补码。
为了能够让计算机存储文本数据,给每个字符关联了一个固定的数字,用来对这个字符进行储存,每个字符关联的那个数字就是这个字符的编码值。
1、编码表
1)ASCII码表
用一个字节来保存字符的编码值(码值范围:0~127)
a、数字在字母的前面(字符0~字符9的编码值连续递增)
b、大写字母在小写字母的前面(字母之间是连续递增)
c、大写字母和小写字母之间还有其他符号(不连续)
2)Unicode编码表
Unicode编码表是对ASCII表的扩展(Unicode编码表中包含了ASCII表中所有的符号)
Unicode编码表中包含了世界上所有国家所有民族的所有符号
中文范围:4e00~9fa5
2、编码相关函数
1)chr函数
语法:chr(编码值) - 获取指定的编码对应的字符
例:
print(chr(0x0f00))
count = 0
for i in range(0x4e00, 0x9fa5):
print(chr(i), end=