一、字符
1. 什么是字符(str
)
-
容器型数据类型; 将’‘、“”、’‘’‘’'、“”“”""作为容器标志,里面的每个符合就是字符串中的元素
-
元素: 可以是任何文字符号,包括:数字、字母、汉字、日语、韩语、表情符号、标点等
不可变的(不支持增删改);有序的(支持下标操作)
任何文字符号都可以是字符串的元素
str1 = '10,20,30' # 里边有8个元素
str2 = '12,=)*/DC键🙂❀'
三个引号开头三个引号结束的字符串,在字符串中可以直接按回车换行
str3 = '123\nsdf'
print(str3)
str4 = """123
sdf"""
print(str4,type(str4))
2.转义字符
-
字符 - 字符串中的元素(字符串每一个独立的符号)
-
字符串的字符可以分为两种: 普通字符、转义字符
-
**普通字符: ** 在字符串中表示符号本身的字符
-
转义字符: \和特定的一些符号组合在一起表示特殊功能或者意义的字符
转义字符是C语言创建的,但是很多都没有存在的价值了,目前常用的转义字符
转义字符 | 作用 |
---|---|
\n | 换行 |
\t | 水平制表符(相当于按一次tab键) |
\ ’ |
表示一个普通的单引号 |
\ " |
表示一个普通的双引号 |
\ | 表示一个普通反斜杠 |
\u四位的16进制数 - 编码字符
str5 = 'abc'
print(str5) # abc
str6 = '\m\k\l'
print(str6) # \m\k\l
有一些C语言中转义字符,在其他编程语言中无效
str7 = 'ab\acde\f'
print(str7)
str8 = '\tabcdkf\n25586'
print(str8)
str9 = 'it\'s me'
str10 = "it's me"
print(str9,str10)
str11 = "I say : \"you see see, one day day\""
str12 = 'I say : \"you see see, one day day\"'
print(str11,str12,sep='\n')
str13 = '\\name\yuting\论文.txt'
print(str13)
编码字符
str14 = '\u78efdjvn '
print(str14)
str14 = '\u34efdjvn '
print(str14)
3.r-string(r字符串)
- 在字符串的最前面加r或者R,可以让字符串中所有的转义字符功能消失(让字符串中所有字符变成普通字符)
str1 = '\tabc\n123'
str2 = r'\tabc\n123'
print(str1)
print(str2)
二、字符编码
1.编码值
- 计算机存储数据的时候只能存储数字(存的是数字对应的二进制的补码)
- 为了能够让计算机存储字符,给每个字符对应一个固定的数字,每次需要存储这个字符的时候就去存这个数字;
- 每个字符对应的那个数字就是这个字符的编码值
2.编码表
编码表是用来保存不同字符对应的编码值的表
1. ASCII码表
有128个字符对应的编码值(只要包含英文符号和其他西欧语言对应的符号)
数字字符0~9从48开始连续递增 0~9 -> 48~57
大写字母A~Z从65开始连续递增 A~Z -> 65~90
大写字母a~z从97开始连续递增 a~z -> 97~122
2. Unicode编码表(Python)
是ASCII码表的扩展(包含了ASCII码表的数据),包含世界上所有国家和民族的语言对应符号
- 中文范围: 4e00 ~ 9fa5
3.Python程序对编码值的应用
1. chr(编码值) - 获取指定编码值对应字符
print(chr(97),chr(65))
# 打印所有大写字母
for i in range(65,91):
print(chr(i))
print(chr(0x4e00),chr(