最近温习Python基础知识,简单记录下,也帮自己巩固下基础知识。
一、容器,可迭代对象,迭代器
首先理解下什么是容器,列表(list: [0, 1, 2]),元组(tuple: (0, 1, 2)),字典(dict: {0:0, 1:1, 2:2}),集合(set: set([0, 1, 2]))都是容器。对于容器,你可以很直观地想象成多个元素在一起的单元;而不同容器的区别,正是在于内部数据结构的实现方法。然后,你就可以针对不同场景,选择不同时间和空间复杂度的容器。
所有的容器都是可迭代的(iterable)。这里的迭代,和枚举不完全一样。迭代可以想象成是你去买苹果,卖家并不告诉你他有多少库存。这样,每次你都需要告诉卖家,你要一个苹果,然后卖家采取行为:要么给你拿一个苹果;要么告诉你,苹果已经卖完了。你并不需要知道,卖家在仓库是怎么摆放苹果的。
严谨地说,迭代器(iterator)提供了一个 next 的方法。调用这个方法后,你要么得到这个容器的下一个对象,要么得到一个 StopIteration 的错误(苹果卖完了)。你不需要像列表一样指定元素的索引,因为字典和集合这样的容器并没有索引一说。比如,字典采用哈希表实现,那么你就只需要知道,next 函数可以不重复不遗漏地一个一个拿到所有元素即可。
而可迭代对象,通过 iter() 函数返回一个迭代器,再通过 next() 函数就可以实现遍历。for in 语句将这个过程隐式化。
那么for in 做了那些事情那?请看...
for...in...循环的本质
1.判断是否是可迭代对象
1.1 是 可迭代对象
1.1.1 通过可迭代对象的iter()函数,调用可迭代对象中的__iter__方法的的来返回可迭代对象的迭代器,
1.1.2 然后通过迭代器的next()函数,调用迭代器的__next__方法返回数据
1.1.3 直到异常StopIteration产生,退出迭代for...in...过程.
1.2 否 报错`TypeError: 'xxx' object is not iterable`
二、迭代器、生成器
生成器是一种特殊的迭代器,生成器自动实现了“迭代器协议”(即__iter__和next方法),不需要再手动实现两方法。
生成器在迭代的过程中可以改变当前迭代值,而修改普通迭代器的当前迭代值往往会发生异常,影响程序的执行
具有yield关键字的函数都是生成器,yield可以理解为return,返回后面的值给调用者。不同的是return返回后,函数会释放,而生成器则不会。在直接调用next方法或用for语句进行下一次迭代时,生成器会从yield下一句开始执行,直至遇到下一个yield。
也可以把列表的[x, x, x]换成 (x, x, x),也是一种生成器
生成器实例,看不太懂的可以自己运行一下,了解下期中运行方式:
def generator(k):
i = 1
while True:
yield i ** k
i += 1
gen_1 = generator(1)
gen_3 = generator(3)
print(gen_1)
print(gen_3)
def get_sum(n):
sum_1, sum_3 = 0, 0
for i in range(n):
next_1 = next(gen_1)
next_3 = next(gen_3)
print('next_1 = {}, next_3 = {}'.format(next_1, next_3))
sum_1 += next_1
sum_3 += next_3
print(sum_1 * sum_1, sum_3)
get_sum(8)
########## 输出 ##########
<generator object generator at 0x000001E70651C4F8>
<generator object generator at 0x000001E70651C390>
next_1 = 1, next_3 = 1
next_1 = 2, next_3 = 8
next_1 = 3, next_3 = 27
next_1 = 4, next_3 = 64
next_1 = 5, next_3 = 125
next_1 = 6, next_3 = 216
next_1 = 7, next_3 = 343
next_1 = 8, next_3 = 512
1296 1296
我们在来看一道力扣题:给定两个序列,判定第一个是不是第二个的子序列,举个例子,[1, 3, 5] 是 [1, 2, 3, 4, 5] 的子序列,[1, 4, 3] 则不是。题目地址:判定子序列
可以巧用生成器,迭代器:
def is_subsequence(a, b):
b = iter(b)
return all(i in b for i in a)
print(is_subsequence([1, 3, 5], [1, 2, 3, 4, 5]))
print(is_subsequence([1, 4, 3], [1, 2, 3, 4, 5]))
########## 输出 ##########
True
False
简单总结下:
- 容器是可迭代对象,迭代器一定是可迭代对象,迭代对象不一定是迭代器(list等),生成器是一种特殊的迭代器,迭代器中特殊的一种是生成器
- 如果一个对象拥有__iter__方法,其是可迭代对象;如果一个对象既拥有__iter__又拥有__next__方法,其是迭代器
- 定义可迭代对象,必须实现__iter__方法;定义迭代器,必须实现__iter__和__next__方法(可迭代对象调用 iter() 函数,可以得到一个迭代器)
- 使用生成器,你可以写出来更加清晰的代码;合理使用生成器,可以降低内存占用、优化程序结构、提高程序速度。