nc119 最小的k个数:
给定一个数组,找出其中最小的K个数。例如数组元素是4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4。如果K>数组的长度,那么返回一个空的数组
两种方法。第一种方法是基于划分的方法,如果是查找第k个数字,第一次划分之后,划分的位置如果大于k,那么就在前面的子数组中进行继续划分,反之则在后面的子数组继续划分,时间复杂度O(n);第二种方法是可以适用于海量数据的方法,该方法基于二叉树或者堆来实现,首先把数组前k个数字构建一个最大堆,然后从第k+1个数字开始遍历数组,如果遍历到的元素小于堆顶的数字,那么久将换两个数字,重新构造堆,继续遍历,最后剩下的堆就是最小的k个数,时间复杂度O(nlog k)。
def GetLeastNumbers_Solution(arr,k):
"""
冒泡排序:升序
"""
m=len(arr)
for i in range(m-1):
for j in range(i+1,m):
if arr[i]>arr[j]:
arr[i],arr[j]=arr[j],arr[i]
return arr[:k]
arr=[1,2,3,4,1,3]
GetLeastNumbers_Solution(arr,3)
def fastsort(arr,k):
"""
快速排序法:升序
"""
d=[[],[],[]]
basenum=arr[-1]
for i in arr:
if i>basenum:
d[2].append(i)
elif i<basenum:
d[0].append(i)
else:
d[1].append(i)
if len(d[0])>1:
d[0]=fastsort(d[0],k)#递归
if len(d[1])>1:
d[2]=fastsort(d[2],k)
d[0].extend(d[1])
d[0].extend(d[2])
return d[0][:k]
arr=[1,2,3,4,1,3]
fastsort(arr,3)
'''
输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4。
'''
class Solution:
# O(n)的算法, 只有当我们可以修改输入的数组时可用
# 基于Partition的方法
def GetLeastNumbers_Solution(self, tinput, k):
if tinput == None or len(tinput) < k or len(tinput) <= 0 or k <=0:
return []
n = len(tinput)
start = 0
end = n - 1
index = self.Partition(tinput, n, start, end)
while index != k-1:
if index > k-1:
end = index - 1
index = self.Partition(tinput, n, start, end)
else:
start = index + 1
index = self.Partition(tinput, n, start, end)
output = tinput[:k]
output.sort()
return output
def Partition(self, numbers, length, start, end):
if numbers == None or length <= 0 or start < 0 or end >= length:
return None
if end == start:
return end
pivotvlue = numbers[start]
leftmark = start + 1
rightmark = end
done = False
while not done:
while numbers[leftmark] <= pivotvlue and leftmark <= rightmark:
leftmark += 1
while numbers[rightmark] >= pivotvlue and rightmark >= leftmark:
rightmark -= 1
if leftmark > rightmark:
done = True
else:
numbers[leftmark], numbers[rightmark] = numbers[rightmark], numbers[leftmark]
numbers[rightmark], numbers[start] = numbers[start], numbers[rightmark]
return rightmark
# O(nlogk)的算法, 适合海量数据
# 利用一个k容量的容器存放数组, 构造最大堆, 当下一个数据大于最大数, 跳过, 小于最大数, 则进入容器替换之前的最大数
def GetLeastNumbers(self, tinput, k):
import heapq
if tinput == None or len(tinput) < k or len(tinput) <= 0 or k <= 0:
return []
output = []
for number in tinput:
if len(output) < k:
output.append(number)
else:
# 构造最小堆, 不推荐
# output = heapq.nsmallest(k, output)
# if number >= output[-1]:
# continue
# else:
# output[-1] = number
# 构造最大堆, 推荐
output = heapq.nlargest(k, output)
if number >= output[0]:
continue
else:
output[0] = number
return output[::-1] # 最小堆用 return output
tinput = [4,5,1,6,2,7,3,8]
s = Solution()
print(s.GetLeastNumbers_Solution(tinput, 4))
print(s.GetLeastNumbers(tinput, 4))
print(s.GetLeastNumbers(tinput, 5))
# -*- coding:utf-8 -*-
import heapq
class Solution:
def GetLeastNumbers_Solution(self, tinput, k):
# write code here
heaps =[]
ret=[]
for num in tinput:
heapq.heappush(heaps,num)
if k>len(heaps):
return []
for i in range(k):
ret.append(heapq.heappop(heaps))
return ret