字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串。
创建字符串很简单,只要为变量分配一个值即可。例如:
var1 = 'Hello World!'var2= "Runoob"
Python字符串访问及运算符
操作符描述实例
+
字符串连接
a + b 输出结果: HelloPython
*
重复输出字符串
a*2 输出结果:HelloHello
[]
通过索引获取字符串中字符
a[1] 输出结果 e
[ : ]
截取字符串中的一部分
a[1:4] 输出结果 ell
in
成员运算符 - 如果字符串中包含给定的字符返回 True
H in a 输出结果 1
not in
成员运算符 - 如果字符串中不包含给定的字符返回 True
M not in a 输出结果 1
r/R
原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母"r"(可以大小写)以外,与普通字符串有着几乎完全相同的语法。
print r'\n' prints \n 和 print R'\n' prints \n
%
格式字符串
请看下一节内容。
使用举例:
#!/usr/bin/python3 -B
if __name__ == '__main__':
a= "Hello"b= "Python"
print("a + b:", a +b)print("a * 2:", a * 2)print("a[1] :", a[1])print("a[1:4]:", a[1:4])if( "H" ina) :print("H in a")else:print("H not in a")if( "M" not ina) :print("M not in a")else:print("M in a")print(r'\n') #原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符
print(R'\n')
实际输出如下:
a + b: HelloPython
a * 2: HelloHello
a[1] : e
a[1:4]: ell
H in a
M not in a
\n
\n
Python字符串格式化
Python的字符串格式化有两种方式:%格式符方式,format方式
%格式化格式:%[(name)][flags][width].[precision]typecode
(name) 可选,用于选择指定的key
flags 可选,可供选择的值有:width可选,占有宽度
+ 右对齐;正数前加正好,负数前加负号;
- 左对齐;正数前无符号,负数前加负号;
空格 右对齐;正数前加空格,负数前加负号;
0 右对齐;正数前无符号,负数前加负号;用0填充空白处
.precision 可选,小数点后保留的位数
typecode 必选
s,获取传入对象的__str__方法的返回值,并将其格式化到指定位置
r,获取传入对象的__repr__方法的返回值,并将其格式化到指定位置
c,整数:将数字转换成其unicode对应的值,10进制范围为 0 <= i <= 1114111(py27则只支持0-255);字符:将字符添加到指定位置
o,将整数转换成 八 进制表示,并将其格式化到指定位置
x,将整数转换成十六进制表示,并将其格式化到指定位置
d,将整数、浮点数转换成 十 进制表示,并将其格式化到指定位置
e,将整数、浮点数转换成科学计数法,并将其格式化到指定位置(小写e)
E,将整数、浮点数转换成科学计数法,并将其格式化到指定位置(大写E)
f, 将整数、浮点数转换成浮点数表示,并将其格式化到指定位置(默认保留小数点后6位)
F,同上
g,自动调整将整数、浮点数转换成 浮点型或科学计数法表示(超过6位数用科学计数法),并将其格式化到指定位置(如果是科学计数则是e;)
G,自动调整将整数、浮点数转换成 浮点型或科学计数法表示(超过6位数用科学计数法),并将其格式化到指定位置(如果是科学计数则是E;)
%,当字符串中存在格式化标志时,需要用 %%表示一个百分号
注:Python中百分号格式化是不存在自动将整数转换成二进制表示的方式
#!/usr/bin/python3 -B
if __name__ == '__main__':#s-获取name的__str__返回值 d将age显示为十进制
str1 = '%(name)s-----%(age)d'%{'name':'dsw', 'age':44}print(str1)#+10:name占10个字节并右对齐 -10:age占10个字节并左对齐
str2 = '%(name)+10s----------%(age)-10d---------'%{'name':'dsw', 'age':44}print(str2)#d:year右对齐,正数前加空格,负数前加负号
#010d:右对齐,正数前无符号,负数前加负号,用0填充空白处
str3 = "------%(year) d******%(age)010d" % {'year': 2016, 'age': -20}print(str3)
str4= "------%(year) d******%(age)010d" % {'year': -2016, 'age': 20}print(str4)#.2f 只保留2位小数 f默认保留6位
str5 = '--------%(p).2f'%{'p':1.23456}print(str5)
str6= '--------%(p)f'%{'p':1.23456}print(str6)
str7='***%c***%o***%x'%(65,15,15)print(str7)
str8= '-----%(num)g------%(num1)G'%{'num':1000000000,'num1':100}print(str8)
实际输出:
dsw-----44
dsw----------44 ---------
------ 2016******-000000020
-------2016******0000000020
--------1.23
--------1.234560
***A***17***f
-----1e+09------100
自python2.6开始,新增格式化字符串的函数str.format()。那么,他跟之前的%型格式化字符串相比,更加简单形象
format格式化格式:[[fill]align][sign][#][0][width][,][.precision][type]
fill [可选]空白处填充的字符
align [可选]对齐方式(需配合width使用)
>, 内容右对齐(默认)
=, 内容右对齐,将符号放置在填充字符的左侧,且只对数字类型有效。 即使:符号+填充物+数字
^, 内容居中
sign [可选]有无符号数字# [可选]对于二进制、八进制、十六进制,如果加上#,会分别显示 0b/0o/0x,否则不显示
+, 正号加正,负号加负;
-, 正号不变,负号加负;
空格, 正号空格,负号加负;
, [可选]为数字添加分隔符,如:1,000,000
width [可选]格式化位所占宽度
.precision [可选]小数位保留精度
type [可选]格式化类型
传入” 字符串类型 “的参数:
s,格式化字符串类型数据
空白,未指定类型,则默认是None,同s
传入“ 整数类型 ”的参数
b,将10进制整数自动转换成2进制表示然后格式化
c,将10进制整数自动转换为其对应的unicode字符
d,十进制整数
o,将10进制整数自动转换成8进制表示然后格式化;
x,将10进制整数自动转换成16进制表示然后格式化(小写x)
X,将10进制整数自动转换成16进制表示然后格式化(大写X)
传入“ 浮点型或小数类型 ”的参数
e, 转换为科学计数法(小写e)表示,然后格式化;
E, 转换为科学计数法(大写E)表示,然后格式化;
f , 转换为浮点型(默认小数点后保留6位)表示,然后格式化;
F, 转换为浮点型(默认小数点后保留6位)表示,然后格式化;
g, 自动在e和f中切换
G, 自动在E和F中切换
%,显示百分比(默认显示小数点后6位)
#!/usr/bin/python3 -B
if __name__ == '__main__':
str1= 'my name is:{0}, age:{1}'.format('kzc',18)print(str1)
#为参数占位符
str2= 'my name is:{}, age:{}'.format('kzc', 18)print(str2)#format函数可以接受不限个参数,位置可以不按顺序,可以不用或者用多次
str3 = 'my name is:{0}, age:{1} name is:{0}'.format('kzc', 18)print(str3)
str4= 'my name is:{name}, age:{age}'.format(age=11, name='dsw')print(str4)
info= ['dsw', 33]#{0}{1}是相对.format中的参数个数来定的
str5 = 'my name is:{0[0]}, age:{0[1]}'.format(info)print(str5)
它有着丰富的的“格式限定符”(语法是{}中带:号),比如和填充对齐(^:居中,<:>:右对齐)、精度与类型、进制类型(b:二进制,d:十进制,o:八进制,x:十六进制)
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充
#!/usr/bin/python3 -B
if __name__ == '__main__':#*:填充字符 ^:居中 20字符串显示宽度
str1 = '---{:*^20s}---'.format('welcome')print(str1)
str2='---{:*>20s}---'.format('welcome')print(str2)
str3='---{:*<20s}---'.format('welcome')print(str3)
str4= "numbers: {:b},{:o},{:d},{:x},{:X}, {:%},{:c}".format(15, 15, 15, 15, 15, 15.87623,65)print(str4)
str5= "numbers: {0:b},{0:o},{0:d},{0:x},{0:X}, {0:%},{1:c}".format(15,65)print(str5)
str6= "numbers: {num:b},{num:o},{num:d},{num:x},{num:X}, {num:%},{cc:c}".format(num=15,cc=65)print(str6)
str7= '---{:,d}----'.format(10000000)
str8= '---{:.2f}----'.format(1.2345)print(str7)print(str8)
实际输出:
---******welcome*******---
---*************welcome---
---welcome*************---
numbers: 1111,17,15,f,F, 1587.623000%,A
numbers: 1111,17,15,f,F, 1500.000000%,A
numbers: 1111,17,15,f,F, 1500.000000%,A
---10,000,000----
---1.23----
Python转义字符
在需要在字符中使用特殊字符时,python用反斜杠(\)转义字符。如下表:
\(在行尾时)
续行符
\\
反斜杠符号
\'
单引号
\"
双引号
\a
响铃
\b
退格(Backspace)
\e
转义
\000
空
\n
换行
\v
纵向制表符
\t
横向制表符
\r
回车
\f
换页
\oyy
八进制数,yy代表的字符,例如:\o12代表换行
\xyy
十六进制数,yy代表的字符,例如:\x0a代表换行
\other
其它的字符以普通格式输出
Python三引号
python三引号允许一个字符串跨多行,字符串中可以包含换行符、制表符以及其他特殊字符。也就是说在三引号之间输入的内容将被原样保留,之中的单号和双引号不用转义,其中的不可见字符比如/n和/t都会被保留(显示的除外),这样的好处是你可以替换一些多行的文本。三引号让程序员从引号和特殊字符串的泥潭里面解脱出来,自始至终保持一小块字符串的格式是所谓的WYSIWYG(所见即所得)格式的。
一个典型的用例是,当你需要一块HTML或者SQL时,这时用字符串组合,特殊字符串转义将会非常的繁琐。实例如下:
#!/usr/bin/python3 -B
if __name__ == '__main__':
para_str= """这是一个多行字符串的实例
多行字符串可以使用制表符
TAB ( \t )。
也可以使用换行符 [ \n ]。"""
print(para_str)
输出:
这是一个多行字符串的实例
多行字符串可以使用制表符
TAB ( )。
也可以使用换行符 [
]。
Unicode 字符串
在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀 u。
在Python3中,所有的字符串都是Unicode字符串。
Python 的字符串内建函数
Python 的字符串常用内建函数如下:
序号方法及描述
1
capitalize()
将字符串的第一个字符转换为大写
2
3
4
5
6
endswith(suffix, beg=0, end=len(string))
检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
23
24
25
26
29
30
31
32
33
34
35
36
37
38
39
40