字符串
一. 什么是字符串(str)
容器型数据类型;将’‘或者""或者’’’’’‘或者""""""作为容器标志,引号中每个符号就是字符串的元素。
(’’’’’'和""""""在表示字符串内容的时候换行可以不使用转义字符,而是直接按回车)
字符串不可变(不支持增删改);字符串有序(支持下标操作)
元素:引号中的单独的每个符号都是字符串的元素(又叫字符),字符可以任何符号。
字符分为两类:普通字符(表示符号本身字符)、转义字符(符号的存在具有特殊的功能和意义)
str1 = '90,100'
str2 = "abc767=-=#%~中国大陆😁"
str3 = 'abc\n123'
str4 = '''abc
123'''
str5 = """abc
123
xy
"""
str6 = 'abc\n123' # 'ABC123'
print(str6)
二.字符串的元素 - 字符
字符分为普通字符和转义字符两种
转义字符 - 在特定符号前加/让符号具备特殊的功能,常用转义字符如下:
\n - 换行
\t - 水平制表符(相当于tab键的功能)
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
\ - 表示一个普通的反斜杠
一个转义符的长度是1
\u4位的字符编码值(4位的十六进制数) - 编码字符
str7 = '\tabc\n123'
print(str7)
str8 = 'it\'s me!'
print(str8)
str9 = "it's me!"
print(str9)
str10 = "I say:\"you see see, one day day!\""
print(str10)
str11 = 'I say:"you see see, one day day!"'
print(str11)
str12 = 'abc\\name\u4eff'
print(str12) # abc\name仿
str13 = '' # "",'''''',""""""
print(type(str13), len(str13))
1. 编码
计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储到计算机中的。
为了能够让计算具备存储文字符号的能力,我们给所有的文字符号对应的一个固定的数字,每次要存储符号的时候就把符号对应的数字存起来。
符号对应的数字就是符号的编码值
2. 编码表
编码表保存符号和数字对应关系的表
1)ASCII码表
a. 总共有128个字符(美国符号)
b. 数字在字母的前面;大写字母在小写字母前面;大写字母和小写字母之间有其他符号
2)Unicode编码表(Python)
a. Unicode编码表是对ASCII表的扩展,包含了世界上所有的国家所有的民族所有语言的符号(又称万国码),总共:65536个
b. 中文范围:4e00 ~ 9fa5
3)编码值在Python中的使用
a. chr函数: chr(编码值) - 获取编码值对应的字符
b. ord函数: ord(字符) - 获取字符的编码值
c. 编码字符: \u4e00 (4e00就是一个16进制的编码值)
注意:python中需要字符的地方都必须使用长度为1的字符串赋值
3.字符编码相关函数
1) chr
print(chr(97))
print(chr(35), chr(0x23))
print(chr(0x4e00)) # 一
print(chr(0x9fa5)) # 龥
2) ord
print(ord('一'), ord('二')) # 19968 20108
三.字符串相关操作
1. 查
查 - 获取字符串的字符
字符串获取字符的语法和列表获取元素的语法一模一样
str1 = '\tabc\n123\'+-'
print(str1[1])
print(str1[-1])
# print(str1[100]) # IndexError: string index out of range
print(str1[5:8], str1[5:-3])
print(str1[1:])
print(str1[::-1])
for x in str1:
print(x)
for index in range(len(str1)):
print(index, str1[index])
for index, item in enumerate(str1):
print(index, item)
2. 数学运算符
数学运算符:+、*
print('hello' + 'world!') # helloworld!
print('hello' * 2) # hellohello
3. 比较运算符
1)比较是否相等:==、!=
print('abc' == 'abc') # True
print('abc' == 'acb') # False
2)比较大小:>、<、>=、<=
两个字符串比较大小,比较的是第一对不相等的字符的编码值的大小
char = ?
判断是否是数字字符: ‘0’ <= char <= ‘9’
判断是否是小写字母: ‘a’ <= char <= ‘z’
判断是否是大写字母: ‘A’ <= char <= ‘Z’
判断是否是字母: ‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’
判断是否是中文: ‘\u4e00’ <= char <= ‘\u9fa5’
print('MNxy' > 'ab') # False
print('你好吗' > 'hello') # True
print('123' > 'KM123') # False
print('M' > 'N')
4. in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('1' in 'abc123') # True
print('abc' in 'abc123') # True
print(10 in [10, 20, 30]) # True
print([10, 20] in [10, 20, 30]) # False
print('ac' in 'abc123') # False
5. r语法(r-string)
r语法(r-string) - 在字符串的前面加r/R
如果在字符串前面加r,那么字符串中所有的转义字符的功能都会消失。(阻止转义)
str4 = r'\tabc\n12\'3\\'
print(str4)
path = R'c:\Users\name\test\a.txt'
print(path)
6. 相关函数
len(字符串)
str(数据) - 将数据转换成字符串(任何类型的数据都可以转换成字符串;转换的时候是在数据的打印值的外面加引号)
eval(字符串) - 去掉字符最外面的引号,获取数据(如果去掉引号后不是一个数据,就计算表达式的结果)
str(100) # '100'
str(12.5) # '12.5'
str([10, 20, 30]) # '[10, 20, 30]'
str([1,2,3]) # '[1, 2, 3]'
# print([1,2,3]) # [1, 2, 3]
str({'a': 10, 'b': 20}) # "{'a': 10, 'b': 20}"
str({'a': 10, "b": 20}) # "{'a': 10, 'b': 20}"
# print({'a': 10, "b": 20}) # {'a': 10, 'b': 20}
str(lambda x: x*2) # '<function <lambda> at 0x10f49d430>'
result1 = eval('100') # 100
print(result1, type(result1)) # 100 <class 'int'>
result2 = eval('[10, 20, 30]') # [10, 20, 30]
print(result2, type(result2)) # [10, 20, 30] <class 'list'>
result3 = eval('10 + 20')
print(result3) # 30
result4 = eval('type(10)')
print(result4) # <class 'int'>
str5 = """{
'student':[
{'name': '小明', 'age': 18},
{'name': '张三', 'age': 20},
],
'name': 'python2104'
}"""
result4 = eval(str5)
print(result4, result4['student'][0])
abc = 200
print(eval('abc')) # abc
a = b = 10
print(eval('a+b')) # a + b
四、字符串相关方法
1. capitalize()
将字符串的第一个字符转换为大写
str1 = 'asdadasds'
print(str1.capitalize()) # Asdadasds
2. center(width, fillchar)
返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。