题目:输入n个整数,输出其中最小的k个。
例如输入1,2,3,4,5,6,7和这8个数字,则最小的4个数字为1,2,3和4。
分析:这道题最简单的思路莫过于把输入的n个整数排序,这样排在最前面的k个数就是最小的k个数。只是这
种思路的时间复杂度为O(nlogn)。我们试着寻找更快的解决思路。我们可以开辟一个长度为k的数组。每次从输
入的n个整数中读入一个数。如果数组中已经插入的元素少于k个,则将读入的整数直接放到数组中。否则长度
为k的数组已经满了,不能再往数组里插入元素,只能替换了。如果读入的这个整数比数组中已有k个整数的最
大值要小,则用读入的这个整数替换这个最大值;如果读入的整数比数组中已有k个整数的最大值还要大,则读
入的这个整数不可能是最小的k个整数之一,抛弃这个整数。这种思路相当于只要排序k个整数,因此时间复杂
度可以降到O(n+nlogk)。通常情况下k要远小于n,所以这种方法要优于前面的思路。
从上面的分析,当长度为k的数组已经满了之后,如果需要替换,每次替换的都是数组中的最大值。在常用
的数据结构中,能够在O(1)时间里得到最大值的数据结构为最大堆。因此我们可以用堆(heap)来代替数组。
STL中的set和multiset为我们做了很好的堆实现,我们可以拿过来用。
参考代码:
例如输入1,2,3,4,5,6,7和这8个数字,则最小的4个数字为1,2,3和4。
分析:这道题最简单的思路莫过于把输入的n个整数排序,这样排在最前面的k个数就是最小的k个数。只是这
种思路的时间复杂度为O(nlogn)。我们试着寻找更快的解决思路。我们可以开辟一个长度为k的数组。每次从输
入的n个整数中读入一个数。如果数组中已经插入的元素少于k个,则将读入的整数直接放到数组中。否则长度
为k的数组已经满了,不能再往数组里插入元素,只能替换了。如果读入的这个整数比数组中已有k个整数的最
大值要小,则用读入的这个整数替换这个最大值;如果读入的整数比数组中已有k个整数的最大值还要大,则读
入的这个整数不可能是最小的k个整数之一,抛弃这个整数。这种思路相当于只要排序k个整数,因此时间复杂
度可以降到O(n+nlogk)。通常情况下k要远小于n,所以这种方法要优于前面的思路。
从上面的分析,当长度为k的数组已经满了之后,如果需要替换,每次替换的都是数组中的最大值。在常用
的数据结构中,能够在O(1)时间里得到最大值的数据结构为最大堆。因此我们可以用堆(heap)来代替数组。
STL中的set和multiset为我们做了很好的堆实现,我们可以拿过来用。
参考代码:
#include <set>
#include <vector>
#include <iostream>
using namespace std;
typedef multiset<int, greater<int> > IntHeap;
/* 在vector里查找最小的k个数 */
void FindKLeastNumbers
(
const vector<int>& data, // 输入的数据
IntHeap& leastNumbers, // 输出的k个最小的数
unsigned int k
)
{
leastNumbers.clear();
if(k ==0 || data.size() < k)
return;
vector<int>::const_iterator iter = data.begin();
for(; iter != data.end(); ++iter)
{
// 如果小于k个数插入到leastNumbers中
if(leastNumbers.size() < k)
leastNumbers.insert(*iter);
else // leastNumbers包含了k个数并且现在满了
{
// leastNumbers中的第一个数是最大的
IntHeap::iterator iterFirst = leastNumbers.begin();
// 如果小于先前最大的数
if(*iter < *(leastNumbers.begin()))
{
// 替换先前最大的数
leastNumbers.erase(iterFirst);
leastNumbers.insert(*iter);
}
}
}
}