字符串
文章目录
一、认识字符串
1.什么是字符串(str)
字符串是容器数据类型:将’‘或者""或者’’’’’‘或者""""""作为容器标志,引号中每个符号就是字符串的元素。
‘’’’’'和""""""在表示字符串内容的时候换行可以不使用转义字符,而是直接回车
字符串不可变(不支持增删改):字符串有序(支持下标操作)
**元素:**引号中的单独的每个符号都是字符串的元素(又叫字符),字符可以是任何符号,
字符分为两类:普通字符(表示符号本身的字符)、转义字符(符号的存在具有特殊的功能和意义)
2.字符串的元素 - 字符
字符分为普通字符和转义字符两种
转义字符 - 在特定符号前加/让符号具备特殊的功能,常用转义字符如下:
\n - 换行
\t - 水平制表(相当于tab键的功能)
’ - 表示一个普通的单引号
" - 表示一个普通的双引号
\ - 表示一个普通的反斜杠
注:一个转义字符的长度是1
\u4位的十六进制数 - 编码字符
空串:’’,"",’’’’’’,""""""
3.字符编码
1.编码
计算机只能直接存储数字(而且保存的数字的二进制的补码),文字符号是无法直接存储到计算机中的。
为了能够让计算机具备存储文字符号的能力,我们给所有的文字符号对应的一个固定的数字,每次要存储符号时,就把符号对应的数字存起来。
符号对应的数字就是符号的编码值
2.编码表 - 保存符号和数字对应关系的表
1)ASCII码表
a:总共有128个字符(美国符号)
b:数字在字母的前面,大写字母在小写字母的前面,大写字母和小写字母之间有其他符号
2)Unicode编码表(Python)
a:Unicode编码表是对ASCII表的扩展,包含了世界上所有的国家所有的民族所有语言的符号(又称万国码),总共:65536个
b:中文范围:4e00 ~ 9fa5
3)编码值在Python中的使用
a:chr函数:chr(编码值) - 获取编码值对应的字符
b:ord函数:ord(字符) - 获取字符的编码值
c:编码字符:\u4e00(4e00就是1个16进制的编码值)
注意:Python中需要字符的地方都必须使用长度为1的字符串赋值
二、字符串相关操作
1.查 - 获取字符串的字符
字符串获取字符的语法和列表获取元素的语法一模一样,运用for循环进行
str1 = '\tabc\n123\'+-'
print(str1[1])
print(str1[-1])
print(str1[5:8], str1[5:-3])
for x in str1:
print(x)
2.数学运算符:+、*
print('123' + 'abc') # '123abc'
print('123' * 2) #'123123'
3.比较运算符
1)比较是否相等:==、 !=
2)比较大小:> / < / >= / <=
两个字符串比较大小,比较的是第一对不相等的字符的编码值大小
char = ?
判断是否是数字字符:‘0’ <= char <= ‘9’
判断是否是小写字母:‘a’ <= char <= ‘z’
判断是否是大写字母:‘A’ <= char <= ‘Z’
判断是否是字母:‘a’ <= char <= ‘z’ or ‘A’ <= char <= ‘Z’
判断是否是中文:’\u4e00’’ <= char <= ‘\u9fa5’’
str3 = '你好loe--23=sks;M9JHkyu是-12山卡拉'
# 1)统计中文字符的个数
# 2)打印字符串中所有的数字字符
# 3)提取字符串中所有的字母
count = 0
for x in str3:
if '\u4e00' <= x <= '\u9fa5':
count += 1
print(count)
print('=================================')
for x in str3:
if '0' <= x <= '9':
print(x)
print('=================================')
str_e = ''
for x in str3:
if 'a' <= x <= 'z' or 'A' <= x <= 'Z':
str_e += x
print(str_e)
4.in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)