参考文献: 廖雪峰的官方网站
切片
L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack']
L[0:3] # 取前三个元素 0 1 2
L[:3] # 从索引0开始取,直到索引为3(索引3 不取 )
L[-3:-2] # 从后面开始取 倒数第三个 至倒数第二个
L[:2:] # 步长,每隔两个取一个
L[:] # 复制原list
注: tuple 和 list 的 操作相同,不同的是tuple切片后得到的是tuple,list切片后得到的是list
迭代
在python中 使用 for ... in ...
来进行迭代
对于list和tuple 可以使用下标来迭代
对于dict使用key迭代
d = {'a': 1, 'b': 2, 'c': 3}
for key in d: # 使用key迭代
print(value)
for value in d.value(): # 使用value迭代
for key value in d: # 使用key和value迭代
判断是否为可迭代对象
>>> from collections import Iterable
>>> isinstance('abc', Iterable) # str是否可迭代
True
对list进行向Java一样的下标式的迭代,enumerate函数可以把一个list变成索引-元素对
>>> for i, value in enumerate(['A', 'B', 'C']):
... print(i, value)
上面的for循环里,同时引用了两个变量,在Python里是很常见的,比如下面的代码:
>>> for x, y in [(1, 1), (2, 4), (3, 9)]:
... print(x, y)
列表生成器
for循环后面还可以加上if判断,这样我们就可以筛选出仅偶数的平方:
>>> [x * x for x in range(1, 11) if x % 2 == 0]
[4, 16, 36, 64, 100]
等价于
for x in range(1,11):
if x % 2 == 0:
x * x
还可以使用两层循环,可以生成全排列:
>>> [m + n for m in 'ABC' for n in 'XYZ']
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
列表生成式使用两个变量来生成list
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' }
>>> [k + '=' + v for k, v in d.items()]
['y=B', 'x=A', 'z=C']
if … else
使用列表生成式的时候,有些童鞋经常搞不清楚if…else的用法。
例如,以下代码正常输出偶数:
>>> [x for x in range(1, 11) if x % 2 == 0]
[2, 4, 6, 8, 10]
但是,我们不能在最后的if加上else:
>>> [x for x in range(1, 11) if x % 2 == 0 else 0]
File "<stdin>", line 1
[x for x in range(1, 11) if x % 2 == 0 else 0]
^
SyntaxError: invalid syntax
这是因为跟在for后面的if是一个筛选条件,不能带else,否则如何筛选?
另一些童鞋发现把if写在for前面必须加else,否则报错:
>>> [x if x % 2 == 0 for x in range(1, 11)]
File "<stdin>", line 1
[x if x % 2 == 0 for x in range(1, 11)]
^
SyntaxError: invalid syntax
这是因为for前面的部分是一个表达式,它必须根据x计算出一个结果。因此,考察表达式:x if x % 2 == 0,它无法根据x计算出结果,因为缺少else,必须加上else:
>>> [x if x % 2 == 0 else -x for x in range(1, 11)]
[-1, 2, -3, 4, -5, 6, -7, 8, -9, 10]
上述for前面的表达式x if x % 2 == 0 else -x才能根据x计算出确定的结果。
可见,在一个列表生成式中,for前面的if … else是表达式,而for后面的if是过滤条件,不能带else。
生成器(generator)
L = [x * x for x in range(10)] # 列表生成式
g = (x * x for x in range(10)) # 生成器
列表在内存中保存所有的元素。占用较大的空间;
生成器只在内存中保存元素生成的算法,占用少量空间
可以通过next()返回g的下一个值
>>> next(g)
0
>>> next(g) # 调用一次生成一个值
1
直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。
由于generator是可迭代对象,可以使用for循环
>>> for n in g:
... print(n)
如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator
generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。
用for循环调用generator时,发现拿不到generator的return语句的返回值。如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中
def fib(max):
n, a, b = 0, 0, 1
while n < max:
yield b
a, b = b, a + b
n = n + 1
return 'done'
#*************************
g = fib(6)
while True:
print(next(g))
#---------------------------------------------------------------------------
#StopIteration Traceback (most recent call last)
#<ipython-input-23-3e19b7fa0ff6> in <module>
# 8 # print('Generator return value:', e.value)
# 9 # break
#---> 10 print(next(g))
#
#StopIteration: done
#************************
g = fib(6)
while True:
try:
# x = next(g)
# print('g:', x)
print(next(g))
except StopIteration as e:
print('Generator return value:', e.value)
break
1
1
2
3
5
8
Generator return value: done
迭代器
可以直接作用于for循环的数据类型有以下几种:
一类是集合数据类型,如list、tuple、dict、set、str等;
一类是generator,包括生成器和带yield的generator function。
这些可以直接作用于for循环的对象统称为可迭代对象:Iterable。
可以使用isinstance()判断一个对象是否是Iterable对象:
>>> from collections.abc import Iterable
>>> isinstance([], Iterable)
True
>>> isinstance({}, Iterable)
True
可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator。
可以使用isinstance()判断一个对象是否是Iterator对象:
>>> from collections.abc import Iterator
>>> isinstance((x for x in range(10)), Iterator)
True
>>> isinstance([], Iterator)
False
>>> isinstance({}, Iterator)
False
>>> isinstance('abc', Iterator)
False
生成器都是Iterator对象,但list、dict、str虽然是Iterable,却不是Iterator。
把list、dict、str等Iterable变成Iterator可以使用iter()函数:
>>> isinstance(iter([]), Iterator)
True
>>> isinstance(iter('abc'), Iterator)
True