字符串是一个有序的字符集合,Python中没有独立的字符数据类型,字符即长度为1的字符串。
Python的内置数据类型str用于字符串处理。str对象的值为字符类型。str(字符串)是不可变对象。通过len函数可以获取字符串的长度,长度为0,则为空字符串。
字符串可以使用以下4种方式定义。
(1)单引号(' '):包含在单引号中的字符串,其中可以包含双引号
(2)双引号(" "):包含在双引号中的字符串,其中可以包含单引号
大多数使用双引号定义
(3)三单引号(''' ''')或三双引号(""" """):包含在三引号中的字符串,可以跨行
字符串支持序列的基本操作,可以用for循环遍历字符串中每一个字符
字符串也可以通过count获取字符出现的次数
str1 = "abcdefg"
print(str1.count("ef"))
print(str1.count("eg"))
1
0
count可以计算大字符串里小字符串的出现次数
count中可以计算不存在字符串,但若使用index函数,若出现不存在的字符串,程序会报错。
index获得的是第一次出现的索引。
Python常用方法
1.判断类型
方法 | 说明 |
isspace | 若只包含空格,返回True |
isalnum | 如果至少有意字符并且所有字符都是字母或数字返回True |
isalpha | 如果至少有一个字符并且所有字符都是字母则返回True |
isdecimal | 检查字符串是否只包含十进制字符,如果是返回 true |
isdigit | 如果字符串只包含数字则返回 True 否则返回 False.. |
islower | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
isupper | 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
isnumeric | 如果字符串中只包含数字字符,则返回 True,否则返回 False |
istitle | 如果字符串是标题化的(见 title())则返回 True,否则返回 False |
2.查找和替换
startswith(str) | 检查字符串是否以str开头,是则返回True |
endswith(str) | 检查字符串是否以str结束,是则返回True |
find(str,start=0,end=len(string)) | 检测str是否包含在string中,如果start和end指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回-1 |
rfind(str,start=0,end=len(string)) | 类似与find()函数,不过是从右边开始查找 |
index(str,start=0,end=len(string)) | 跟find()方法类似。只不过如果str不在string会报错 |
rindex(str,start=0,end=len(string)) | 类似于index(),不过是从右边开始 |
replace(old_str,new_str,num=string.count(old)) | 吧string中的old_str替换成new_str,如果num指定,则替换不超过num次 |
3.大小写转换
capitalize() | 把字符串的第一个字符大写 |
title() | 把字符串的每个单词首字母大写 |
lower() | 转换string中所有大写字符为小写 |
upper() | 转换string中的小写字母为大写 |
swapcase() | 翻转string中的大小写 |
4.文本对齐
ljust(width) | 返回一个原字符串左对齐,并使用空格填充至长度width的新字符串 |
rjust(width) | 返回一个原字符串右对齐,并使用空格填充至长度width的新字符串 |
center(width) | 返回一个原字符串剧中,并使用空格填充至长度width的新字符串 |
5.去除空白字符
lstrip() | 截掉string左边(开始)的空白字符 |
rstrip() | 截掉string右边(末尾)的空白字符 |
strip() | 截掉string左右两边的空白字符 |
6.拆分和连接
partition(str) | 把字符串string分成一个3元素的元组(str前面,str,str后面) |
rpartition(str) | 类似于partition()函数,不过是从右边开始查找 |
split(str=**,num) | 以str为分隔符切片string,如果num有指定值,则仅分隔num+1个子字符串,str默认包含'\r','\t','\n'和空格 |
splitlines() | 按照行('\r','\n','\r\n')分隔,返回一个包含各行作为元素的列表 |
join(seq) | 以string作为分隔符,将seq中所有的元素(的字符串表示)合并为与i个新的字符串 |
字符串运算符
+ | 字符串连接 |
* | 重复输出字符串 |
[] | 通过索引获取字符串中字符 |
[:] | 截取字符串中的一部分,遵循左闭右开原则 |
in | 如果字符串包含给定的字符返回True |
not in | 如果字符串不包含给定的字符返回True |
r/R | 所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母 r(可以大小写)以外,与普通字符串有着几乎完全相同的语法。 |
% | 格式字符串 |
字符串格式化符号
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数子,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 和%e相同 |
%g | %f和%e的简写 |
%G | %f和%E的简写 |
%p | 用十六进制数格式化变量的地址 |