问题
这几天接连犯了两次小错误,都是在切分列表时发生的。对于一个长度为L的列表,我想把它分成K段,然后每段分别用来做下游任务(如多进程任务分配),但在编程时,我却使用了如下的方式。
bins = int(L/K)
for i in range(K):
sub_list = list[i*bins: (i+1)*bins]
sub_task(sub_list)
这样想当然的话会导致最终列表的尾部可能有部分元素未被包括。
例如,取L=25641,K=512,得到bins=int(25641/512)=int(50.080078125)=50,那么在for循环的最后一次时,所取列表为
list[25550: 25600]
这样最后的41个元素将不被处理而舍弃。
解决
解决方式其实很简单,只需要使用向上取整确定区间长度即可,而不能想当然的使用int进行截尾。这里可以使用python的math库实现。
import math
bins = math.ceil(L/K)
for i in range(K):
sub_list = list[i*bins: (i+1)*bins]
sub_task(sub_list)
反思
都是小错误,编程的时候一定要细心,在细心。