1. 数据结构回顾
所有标准序列操作(索引、切片、乘法、成员资格检查、长度、最小值和最大值)都适用于字符串,但是字符串是不可变序列,因此所有的元素赋值和切片赋值都是非法的。
>>> website = 'http://www.python.org'
>>> website[-3:] = 'com'Traceback (most recent call last):
File"", line 1, in?
website[-3:] = 'com'TypeError: object doesn't support slice assignment
View Code
通过名称来访问其各个值的数据结构。这种数据结构称为映射(mapping) 。字典是Python中唯一的内置映射类型,其中的值不按顺序排列,而是(值)存储在键下。键可能是数、字符串或元组。
2. 字符串
print ( "hello,world!") "hello,world!" 是字符串,字符串在几乎所有真实可用的Python程序中都会存在,并且有多种用法,其中最主要的用法就是表示一些文本。字符串是值,就像数字一样。str,repr和反引号是将Python值转换成 字符串的3种方法。
2.1 字符串基础
a.单引号字符串和转义引号
>>> 'let's go' # 后面的黑色字体部分Python无法识别
SyntaxError: invalid syntax
>>> 'let\'s go' # 在常规字符串中,反斜杠扮演着特殊角色:它对字符进行转义,让你能够在字符串中包含原本无法包含的字符。 反斜线(\),可以换行。
"let's go"
>>> "let's go!" # 用""对'加以区分
"let's go!"
b.拼接字符串
>>> "let's say:" '"hello,world!"'
'let\'s say:"hello,world!"'
>>> 'hello,' + 'world!'
'hello,world!'
可以使用 + 操作符来连接 (粘在一起); 使用 * 操作符重复
>>> word = 'help ' + 'me! '
>>> word
'help me! '
>>> ''
''
>>>
注意:
两个靠着一起的字符串会自动的连接; 上面例子的第一行也可以写成 word = 'Help' 'A'; 这只能用于两个字符串常量, 而不能用于任意字符串表达式。
c.字符串表示,str和repr
Python打印值的时候会保持值在代码中的状态,而不是你希望用户看到的状态,通过使用print,结果将不同。
>>> "Hello, world!"
'Hello, world!'
>>> print("Hello, world!")
Hello, world!
如果再加上表示换行符的编码\n,差别将更明显。
>>> 'hello,\nworld!'
'hello,\nworld!'
>>> print('hello,\nworld!')
hello,
world!
>>>
str,repr和反引号是将Python值转换成 字符串的3种方法。
通常会获得值的合法Python表达式表示。则意味着产生一个解释器易读的表达形式 (或者如果没有这样的语法会给出 SyntaxError ).
str() 函数 ,(实际是类,工厂函数;str和int、long一样,是一种类型。repr仅仅是函数)
使用str能以合理的方式将值转换为用户能够看懂的字符串。例如,尽可能将特殊字符编码转换为相应的字符。
对于那些没有特殊表达的对象, str() 将会与 repr() 返回相同的值. 很多的值, 如数字或一些如列表和字典那样的结构, 使用这两个函数的结果完全一致. 字符串与浮点型则有两种不同的表达。
repr和反引号则把结果字符串转换为合法的Python表达式。
d.长字符串,原始字符串和Unicode
有一些独特而有用的字符串表示方式。例如,有一种独特的语法可用于表示包含换行符或反斜杠的字符串(长字符串和原始字符串)。对于包含特殊符号的字符串,
Python 2还提供了一种专用的表示语法,结果为Unicode字符串。这种语法现在依然管用,但是多余,因为在Python 3中,所有的字符串都是Unicode字符串。 Python 3还引入了一种新语法,用于表示大致相当于老式字符串的字节对象。在处理Unicode编码方面,这种对象依然扮演着重要的角色。
请注意,指定原始字符串时,可使用单引号或双引号将其括起,还可使用三引号将其括起。
i. 长字符串
字符串可以使用一对匹配的三引号对包围: """ 或 '''。当使用三引号时, 回车不需要被舍弃, 他们会包含在字符串里。
>>> print('''This is a very long string. It continues here.
And it's not over yet. "Hello, world!"
Still here.''')
This is a very long string. It continues here.
And it's not over yet. "Hello, world!"
Still here.
>>>
ii. 原始字符串
原始字符串不以特殊方式处理反斜线。
>>> path = 'C:\nowhere'
>>> path
'C:\nowhere'
>>> print(path) # 打印出问题
C: