给定整数数组A[0,1,…,N-1],求这N个数排序后的最大间隔,如给定:1,4,9,3,10,20,其最大间隔为10。
显然,如题所示,可对给定数组进行排序,然后对排序后的结果遍历一遍,相邻两数之间的最大差值即为所求。
那是否有其它更好的方法呢?
首先,我们先引入点儿数学知识:
假设,对于N个正整数,其中最大值和最小值分别为Max,Min,则形成了N-1个间隔,如果这N个数完全均匀分布,则间距全部为(Max-Min)/(N-1)。 如果N个数不是均匀分布的,则间距不均衡,其最大间隔必然大于(Max-Min)/(N-1)。
因此,上面这一段可总结为下面一句话:对于N个正整数,其中最大值和最小值分别为Max,Min,则形成了N-1个间隔,其最大间隔的最小值为(Max-Min)/(N-1)。
解题思路
将N个数用间距(Max-Min)/(N-1)划分成N-1个区间(也可称为桶),则形成最大间隔的两个数不可能落在同一个区间,我们只需统计后一区间的最小值与前一区间的最大值的差即可,最大的差值即为所求。
但是这里有个小问题,需要处理一下。因为题目给定的数据全是整数,则间隔也必然是整数,然而我们通过(Max-Min)/(N-1)算出来的理论值可能是小数,这会造成若干个痛的数据比其它桶大一,从而造成统计误差。
(PS:来源于七月在线学习班)
举个例子:
共有7个数,其最大值为80,最小值为10,如果我们用6个桶,则桶的大小为70/6=11.66,每个桶分别为[10,21],[22,33],[34,44],[45,56],[57,68],[69,80],存在大小为12的桶,比理论下界11.66要大。
因此我们这里使用N个桶,这样就能严格满足上述的理论下界。并且仅会增加一次比较过程,不会其它额外的计算复杂度。
结论
该解题思路是用到了桶排序的思想,从而可以完美解决我们的问题。相比先对数组进行完全排序的解题方式,时间复杂度从原来的
O
(
n
l
o
g
(
n
)
)
O(nlog(n))
O(nlog(n))提高到了
O
(
n
)
O(n)
O(n)。
下面,附上python代码,供参考。
# -*- coding: utf-8 -*-
"""
Created on Sat Jan 19 21:09:04 2019
@author: shuaifeng
"""
"""
构造一个桶结构体,只记录桶中数据的最大值、最小值,及是否存放数据标志位
"""
class tagSBucket():
def __init__(self):
self.isvalid=False #桶中是否有数据,初始化时为否,表示为没有数据
self.max=0
self.min=0
def putvalue(self,n):
if not self.isvalid:
self.max=self.min=n
self.isvalid=True
else:
if self.max<n:
self.max=n
elif self.min>n:
self.min=n
def main():
A=[1,40,4,3,8]
Nbucket=[]
maxvalue=-10000#此处取值仅为举例,不严谨,应该为程序允许的最小值
minvalue=100000#此处取值仅为举例,不严谨,应该为程序允许的最大值
#对一个桶结构体数组进行初始化,并求数组最大最小值
for i in A:
if i>maxvalue:
maxvalue=i
elif i<minvalue:
minvalue=i
Nbucket.append(tagSBucket())
thea=maxvalue-minvalue
#遍历数组,放到桶里
for value in A:
bucketindex=int((value-minvalue)*len(A)/thea)
if bucketindex>=len(A):
bucketindex=len(A)-1
Nbucket[bucketindex].putvalue(value)
i=0
minvalue=int((maxvalue-minvalue)/len(A))
#求最大间隔
for j in range(1,len(A)):
if Nbucket[j].isvalid:
if Nbucket[j].min-Nbucket[i].max>minvalue:
minvalue=Nbucket[j].min-Nbucket[i].max
i=j
print(minvalue)
if __name__=='__main__':
main()