Python for 循环中的陷阱_nums = [1, 2, 3, 6, 7, 5, 4] nums = [‘{ 02d}‘

>>> tuple(squares)
(1, 4, 9, 16)

这个时候,如果我们再将这个构造器对象传递给 sum 函数,按理说应该会返回这些数字的和吧:

>>> sum(squares)
0

返回的却是个 0,先托住下巴。

陷阱 2:检查是否包含

我们还是使用上面的数字列表和生成器:

>>> nums = [1, 2, 3, 4]
>>> squares = (n**2 for n in nums)

如果我 squares 生成器中是否包含 9,答案是肯定的,如果我再问一次呢?

>>> 9 in squares
True
>>> 9 in squares
False

发现,第二次不灵了~

陷阱 3:拆包

现在假设有一个字典:

>>> counts = {1:'a', 2:'b'}

然后,我们用多个变量对字典进行拆包:

>>> x,y = counts

你觉得这时候,x 和 y 中会是什么?

>>> x
1
>>> y
2

我们只得到了键。

下面,我们先来了解下 Python 中的循环工作原理,然后再反过头来看这些陷阱问题。

2、一些概念

首先,先了解一些基本概念:

可迭代和序列

可迭代就是指任意可以使用 for 循环遍历的东西,可迭代意味着可以遍历,任何可以遍历的东西都是可迭代的。

for item in some_iterable:
    print(item)

序列是一种常见的可迭代类型,如列表、元组、字符串等。

序列是可迭代的,它有着一些特点,它们是从 0 开始索引,索引长度不超过序列的长度;它们有序列长度;并且它们可以被切分。

Python 中的大部分东西都是可以迭代的,但是可以迭代并不意味着它是序列。如集合、字典、文件和生成器都是可迭代的,但是它们都不是序列。

>>> my_set = {1, 2, 3}
>>> my_dict = {'k1': 'v1', 'k2': 'v2'}
>>> my_file = open('some\_file.txt')
>>> squares = (n**2 for n in my_set)

总结下来就是,任何可以用 for 循环遍历的东西都是可迭代的,序列可迭代的类型中的一种,Python 还有着许多其他种类的可迭代类型。

迭代器

迭代器就是可以驱动可迭代对象的东西。你可以从任何可迭代对象中获得迭代器,你也可以使用迭代器来手动对它的迭代进行遍历。

下面有三个可迭代对象:一个集合、一个元祖和一个字符串:

>>> nums = {1,2,3,4}
>>> coors = (4,5,6)
>>> words = "hello hoxis"

我们可以使用 Python 的内置函数 iter ,从这些可迭代对象中获取到迭代器:

>>> iter(nums)
<setiterator object at 0x7fa8c194ad70>
>>> iter(coors)
<tupleiterator object at 0x7fa8c1959610>
>>> iter(words)
<iterator object at 0x7fa8c19595d0>

一旦我们有了迭代器,我们就可以使用其内置函数  next() 来获取它的下一个值:

>>> nums = {1,2,3,4}
>>> num_iter = iter(nums)
>>> next(num_iter)
1
>>> next(num_iter)
2
>>> next(num_iter)
3
>>> next(num_iter)
4
>>> next(num_iter)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

若果迭代到头了,也就是没有下一个值了,就会抛出 StopIteration 异常。也就是说,它不会继续循环取获取第一个值。

是不是有点懵逼了?

  • 可迭代对象是可以迭代的东西
  • 迭代对象器实际上是遍历可迭代对象的代理
  • 迭代器没有长度,它们不能被索引。
  • 可以使用迭代器来做的唯一有用的事情是将其传递给内置的 next 函数,或者对其进行循环遍历
  • 可以使用 list() 函数将迭代器转换为列表
>>> nums = {1,2,3,4}
>>> num_iter = iter(nums)
>>> next(num_iter)
1
>>> list(num_iter)
[2, 3, 4]
>>> list(num_iter)
[]

若果想再次将其转换为列表,明显地,得到的是一个空列表。

其实这也是迭代器的一个重要特性:惰性,只能使用一次,只能循环遍历一次。并且,在我们调用 next() 函数之前,它不会做任何事情。因此,我们可以创建无限长的迭代器,而创建无限长的列表则不行,那样会耗尽你的内存!

可迭代对象不一定是迭代器,但是迭代器一定是可迭代的:

对象可迭代?迭代器?
可迭代对象不一定
迭代器
生成器
列表×

其实,Python 中有许多迭代器,生成器是迭代器,Python 的许多内置类型也是迭代器。例如,Python 的enumerate 和 reversed 对象就是迭代器。zipmap 和 filter 也是迭代器;文件对象也是迭代器。

关于生成器,你也许会有些懵,后续会单独拉出来给大家分享~

3、Python 中的 for 循环

其实,Python 并没有传统的 for 循环,什么是传统的 for 循环?

我们看下 Java 中的 for 循环:

int[] integers = {1, 2, 3, 4};
for (int j = 0; j<integers.length; j++) {
    int i = integers[j];
    System.out.println(i);
}

这是一种 C风格 的 for 循环,JavaScript、C、C++、Java、PHP 和一大堆其他编程语言都有这种风格的 for 循环,但是 Python 确实没有。

Python 中的我们称之为 for 循环的东西,确切的说应该是 foreach 循环:

numbers = [1, 2, 3, 5, 7]
for n in numbers:
    print(n)

和 C风格 的 for 循环不同之处在于,Python 的 for 循环没有索引变量,没有索引变量的初始化,边界检查和索引变量的增长。

这就是 Python 的 for 循环的不同之处!

使用索引?

你可能会怀疑,Python 的 for 循环是否在底层使用了索引,下面我们手动的使用 while 循环和索引来遍历:

>>> nums = [1,2,3,4]
>>> i = 0
>>> while i < len(nums):
...     print(num[i])
...     i += 1
...
0
1
2
3

对于列表,这样遍历是可以的,但不代表适用于所有可迭代对象,它只适用于序列。

比如,我们对一个 set 使用这种方法遍历,会得到一个异常:

>>> set = {1,2,3}
>>> i = 0
>>> while i < len(set):
...     print(set[i])
...     i += 1
...
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
TypeError: 'set' object does not support indexing

因为 set 不是序列,因此不支持索引遍历。

我们不能使用索引手动对 Python 中的每一个迭代对象进行遍历。对于那些不是序列的迭代器来说,更是行不通的。

实现没有 for 的循环

从上文可以看出,Python 中的 for 循环不使用索引,它使用的是迭代器。让我们来看下它是如何工作的。

通过上文,我们了解到了迭代器和 iter、next 函数,现在我们可以尝试不用 for 循环来遍历一个可迭代对象。

下面是一个正常的 for 循环:

def funky\_for\_loop(iterable, action\_to\_do):
    for item in iterable:
        action_to_do(item)

我们要尝试用迭代器的方法和 while 实现上面 for 循环的逻辑,大致步骤如下:

  1. 获取给定可迭代对象的迭代器;
  2. 调用迭代器的 next() 方法获取下一项;
  3. 对当前项数据进行处理;
  4. 如果捕获到 StopIteration,那么就停止循环
def funky\_for\_loop(iterable, action\_to\_do):
    iterator = iter(iterable)
    while not done_looping:
        try:
            item = next(iterator)
        except StopIteration:
            break
        else:
            action_to_do(item)

Python 底层的循环工作方式基本上如上代码,就是迭代器驱动的 for 循环。

4、再次回到循环陷阱

陷阱 1:耗尽的迭代器

陷阱 1 中,因为生成器是迭代器,迭代器是惰性的,也是一次性的,在已经遍历过一次的情况下,再对其求和,返回的就是一个 0。

陷阱 2:部分消耗迭代器

这段代码是一个伪代码,它没有明确的函数或变量定义。因此,我需要根据上下文进行推测,并将其转化为 Python 代码。 假设我们已经定义了以下函数和变量: ```python import random import math def generate_n_exponential_random_nums(n, lamda): # 生成 n 个符合指数分布的随机数 return [random.expovariate(lamda) for _ in range(n)] def calculate_t_per(random_nums): # 计算 T_per 统计量 return max(random_nums) / sum(random_nums) def calculate_mean_t_per_i(): # 计算 T_per_i 的均值 pass def calculate_and_store_objective_function_value(mean_t_per_i): # 计算并存储目标函数的值 pass def calculate_objective_function_max_value_and_n(): # 计算目标函数的最大值和对应的 n pass n = 2 max_t_per = 0 max_n = 0 lamda = 0.5 ``` 那么,我们可以将伪代码转化为如下的 Python 代码: ```python while n <= 100: random_nums = generate_n_exponential_random_nums(n, lamda) t_per = calculate_t_per(random_nums) if t_per > max_t_per: max_t_per = t_per max_n = n for i in range(100): random_nums = generate_n_exponential_random_nums(n, lamda) t_per_i = calculate_t_per(random_nums) if t_per_i > max_t_per: max_t_per = t_per_i max_n = n mean_t_per_i = calculate_mean_t_per_i() calculate_and_store_objective_function_value(mean_t_per_i) n += 2 objective_function_max_value, objective_function_max_n = calculate_objective_function_max_value_and_n() ``` 以上代码,我们使用 while 循环遍历 n 的取值范围,对于每个 n,我们生成 n 个符合指数分布的随机数,并计算 T_per 统计量。如果 T_per 大于之前的最大值,则更新最大值和对应的 n。接着,我们对于每个 n,重复进行 100 次随机数生成,并计算 T_per_i 统计量。如果 T_per_i 大于之前的最大值,则更新最大值和对应的 n。最后,我们计算 T_per_i 的均值,并计算并存储目标函数的值。整个循环过程,n 每次增加 2。循环结束后,我们计算目标函数的最大值和对应的 n,并将结果保存在 objective_function_max_value 和 objective_function_max_n 变量
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值