Python 字符串
字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串。
注意 Python 中没有像 C++ 表示的字符类型(char),所有的字符或串都被统一为 str 对象。如单个字符 c 的类型也为 str。
创建字符串很简单,只要为变量分配一个值即可。例如:
var1 = 'Hello World!'
var2 = "Python Runoob"
字符串格式化
Python 支持格式化字符串的输出 ,尽管这样可能会用到非常复杂的表达式。
1、使用字符串格式符 %s 插入到指定位置
在 Python 中,字符串格式化使用与 C 中 sprintf 函数一样的语法。如下实例:
print "My name is %s and weight is %d kg!" % ('Xuyu', 60)
-----------------------------------------------------------
My name is Xuyu and weight is 60 kg!
Python字符串格式化符号
符号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %F 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
2、使用format()函数
# 1、按照默认顺序,不指定位置
print("{} {}".format("hello","world") )
-------------------------------------------
hello world
# 2、设置指定位置,可以多次使用
print("{0} {1} {0}".format("hello","or"))
-------------------------------------------
hello or hello
# 3、使用字典格式化
person = {"name":"opcai","age":20}
print("My name is {name} . I am {age} years old .".format(**person))
--------------------------------------------------------------------
My name is opcai . I am 20 years old .
# 4、通过列表格式化
stu = ["Xuyu","linux","MySQL","Python"]
print("My name is {0[0]} , I love {0[3]} , I love {0[1]} !".format(stu))
------------------------------------------------------------------------
My name is Xuyu , I love Python , I love linux !
字符串切片
列表与元组支持都下标索引,字符串实际上就是字符的数组,所以也支持下标索引。如果想取出部分字符,那么可以通过下标的方法(注意python中下标从 0 开始)。
name = 'abcdef'
print(name[0])
print(name[1])
print(name[2])
-------------------------
a
b
c
切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。
切片的语法:[起始:结束:步长]
PS:选取的区间属于左闭右开型,即从"起始"位开始,到"结束"位的前一位结束(不包含结束位本身)。
我们以字符串为例讲解:
name = 'abcdef'
print(name[0:5]) # 取下标为0~4的字符
print(name[3:5]) # 取下标为3、4的字符
print(name[2:]) # 取下标为2开始到最后的字符
print(name[1:-1]) # 取下标为1开始到最后第2个之间的字符
print(name[:3]) # 取下标0~2的字符
print(name[::2]) # 从头到尾,间隔为2
print(name[5:1:-2]) # 从下标为5到2,间隔为2
print(name[::-2]) # 从尾到头,间隔为2
print(name[-2:]) # 取最后2个字符
-----------------------------------------------------------
abcde
de
cdef
bcde
abc
ace
fd
fdb
ef
字符串拼接
1、使用加号(+)拼接
# 字符串之间直接拼接
str1 = 'Xu'
str2 = 'yu'
str_name = str1 + str2
print(str_name)
-----------------------
Xuyu
# 字符串与数字之间拼接,必需把数字的int类型变成str类型
age = 23
print("我今年" + str(age) + "岁了!")
------------------------------------------------
我今年23岁了!
2、使用 .join(iterable) 拼接
用法:str.join(iterable)
使用条件:iterable 是可迭代的, 如列表(list)为 非嵌套列表,且列表元素为字符串(str)类型
# 例子(1)
hobby = ['我', '喜', '欢', 'python','!']
str_name = ''.join(hobby)
print(str_name)
# 例子(2)
# 拼接前缀 ('前缀字符串').join(iterable)
str_name1 = 'QAQ'.join(hobby)
print(str_name1)
# 例子(3)
# 拼接的iterable为字典,其中 key,value 必须为字符串, 默认拼接key的列表
dict_name = {'key1': 'value1', 'key2': 'value2'}
str_key = ','.join(dict_name)
# 拼接value 的列表
str_value = ','.join(dict_name.values())
print(str_key)
print(str_value)
------------------------------------------------------------------------
我喜欢python!
我QAQ喜QAQ欢QAQpythonQAQ!
key2,key1
value2,value1
3、使用逗号( , )拼接
# PS:使用逗号(,)形式要注意一点,就是只能用于print打印,赋值操作会生成元组:
a, b = 'Hello', 'world'
c = a, b
print(a, b)
print(c)
print(type(c))
-------------------------------
Hello world
('Hello', 'world')
<class 'tuple'>
4、使用.format()拼接
# str.format(args,**kwargs)
# 例(1) {} 充当占位符
str_word = 'hello, word! {} {}'.format('我喜欢', 'python')
print(str_word)
# 例(2) {[index]} 按索引位置填充 .format([0]=value1, [1]= value2},)
str_index0= 'hell0, word!{0},{1}'.format('我喜欢', 'python')
str_index1 = 'hell0, word!{1},{0}'.format('我喜欢', 'python')
print(str_index0)
print(str_index1)
# 例(3) {[keyword]}
str_keyword = 'hell0, word!{a},{b}'.format(b='我喜欢', a='python')
print(str_keyword)
# 例(4) {[keyword,indec]} keyword 放在最后
str_word1 = 'hell0, word!{1}{a},{0}{b}'.format('index0', 'index1', b='我喜欢', a='python')
print(str_word1)
# 例(5) format 参数类型不限,当为元祖,列表,集合,字典时输出
str_word2 = 'hell0, word!{b}'.format(b=['eee', 'd'])
print(str_word2)
# 例(6) 作为函数使用
str_word3 = 'hello, word! {} {}'.format
word = str_word3('我喜欢', 'python')
print(word)
------------------------------------------------------------------------------
Hello, world! 我喜欢 python
Hello, world! 我喜欢,python
Hello, world! python,我喜欢
Hello, world! 我喜欢,python
Hello, world! index1python,index0我喜欢
Hello, world! ['eee', 'd']
Hello, world! 我喜欢 python
字符串常用内建函数
方法 | 描述 |
---|---|
string.capitalize() | 把字符串的第一个字符大写 |
string.center(width) | 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串 |
string.count(str, beg=0, end=len(string)) | 返回 str 在 string 里面出现的次数,如果 beg 或者 end 指定则返回指定范围内 str 出现的次数 |
string.decode(encoding=‘UTF-8’, errors=‘strict’) | 以 encoding 指定的编码格式解码 string,如果出错默认报一个 ValueError 的 异 常 , 除非 errors 指 定 的 是 ‘ignore’ 或 者’replace’ |
string.encode(encoding=‘UTF-8’, errors=‘strict’) | 以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是’ignore’或者’replace’ |
string.endswith(obj, beg=0, end=len(string)) | 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False. |
string.expandtabs(tabsize=8) | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8。 |
string.find(str, beg=0, end=len(string)) | 检测 str 是否包含在 string 中,如果 beg 和 end 指定范围,则检查是否包含在指定范围内,如果是返回开始的索引值,否则返回-1 |
string.format() | 格式化字符串 |
string.index(str, beg=0, end=len(string)) | 跟find()方法一样,只不过如果str不在 string中会报一个异常. |
string.isalnum() | 如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False |
string.isalpha() | 如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False |
string.isdecimal() | 如果 string 只包含十进制数字则返回 True 否则返回 False. |
string.isdigit() | 如果 string 只包含数字则返回 True 否则返回 False. |
string.islower() | 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回 True,否则返回 False |
string.isnumeric() | 如果 string 中只包含数字字符,则返回 True,否则返回 False |
string.isspace() | 如果 string 中只包含空格,则返回 True,否则返回 False. |
string.istitle() | 如果 string 是标题化的(见 title())则返回 True,否则返回 False |
string.isupper() | 如果 string 中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False |
string.join(seq) | 以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
string.ljust(width) | 返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串 |
string.lower() | 转换 string 中所有大写字符为小写. |
string.lstrip() | 截掉 string 左边的空格 |
string.maketrans(intab, outtab]) | maketrans() 方法用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。 |
max(str) | 返回字符串 str 中最大的字母。 |
min(str) | 返回字符串 str 中最小的字母。 |
string.partition(str) | 有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把 字 符 串 string 分 成 一 个 3 元 素 的 元 组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string. |
string.replace(str1, str2, num=string.count(str1)) | 把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次. |
string.rfind(str, beg=0,end=len(string) ) | 类似于 find()函数,不过是从右边开始查找. |
string.rindex( str, beg=0,end=len(string)) | 类似于 index(),不过是从右边开始. |
string.rjust(width) | 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串 |
string.rpartition(str) | 类似于 partition()函数,不过是从右边开始查找 |
string.rstrip() | 删除 string 字符串末尾的空格. |
string.split(str="", num=string.count(str)) | 以 str 为分隔符切片 string,如果 num 有指定值,则仅分隔 num+ 个子字符串 |
string.splitlines([keepends]) | 按照行(’\r’, ‘\r\n’, \n’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。 |
string.startswith(obj, beg=0,end=len(string)) | 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查. |
string.strip([obj]) | 在 string 上执行 lstrip()和 rstrip() |
string.swapcase() | 翻转 string 中的大小写 |
string.title() | 返回"标题化"的 string,就是说所有单词都是以大写开始,其余字母均为小写(见 istitle()) |
string.translate(str, del="") | 根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 del 参数中 |
string.upper() | 转换 string 中的小写字母为大写 |
string.zfill(width) | 返回长度为 width 的字符串,原字符串 string 右对齐,前面填充0 |
字符串常量
使用前需要导入string库,import string
字符常量 | 描述 |
---|---|
string.ascii_lowercase | 小写字母 ‘abcdefghijklmnopqrstuvwxyz’ |
string.ascii_uppercase | 大写字母 ‘ABCDEFGHIJKLMNOPQRSTUVWXYZ’ |
string.ascii_letters | 上文所述 ascii_lowercase 和 ascii_uppercase 常量的拼连 |
string.digits | 字符串 ‘0123456789’,十进制数字 |
string.hexdigits | 字符串 ‘0123456789abcdefABCDEF’,十六进制数字 |
string.octdigits | 字符串 ‘01234567’,八进制数字 |
string.punctuation | 由在 C 语言区域中被视为标点符号的 ASCII 字符组成的字符串 |
string.whitespace | 由被视为空白符号的 ASCII 字符组成的字符串。 其中包括空格、制表、换行、回车、进纸和纵向制表符 |
string.printable | 由被视为可打印符号的 ASCII 字符组成的字符串。 这是 digits, ascii_letters, punctuation 和 whitespace 的总和。 |