这个算法是解决这样一个问题:从一个数组中找出出现半数以上的元素
算法的基本思想
这个算法是解决这样一个问题:从一个数组中找出出现半数以上的元素
每次都找出一对不同的元素,从数组中删掉,直到数组为空或只有一种元素。 不难证明,如果存在元素e出现频率超过半数,那么数组中最后剩下的就只有e。
当然,最后剩下的元素也可能并没有出现半数以上。比如说数组是[1, 2, 3],最后剩下的3显然只出现了1次,并不到半数。排除这种false positive情况的方法也很简单,只要保存下原始数组,最后扫描一遍验证一下就可以了。
我们可以删除数组元素,但这种方法不方便,我们利用移动数组的下标,初始下标指向第1个元素,往后排查,当发现两个数不同时,下标往后移位,当有两个元素相同时,下标不再移动;下面是C++实现的具体代码:
#include <iostream>
#include <vector>
using namespace std;
int majorityElement1(vector<int> &num);
void main()
{
int a[10]={5,5,4,5,9,5,3,5,7,5};
vector<int >b(a,a+10);
int majority=majorityElement1(b);
cout<<majority;
}
int majorityElement1(vector<int> &num)
{
int majority=0;
int count=1,i;
for (count=1,i=1;i<num.size();i++)
{
num[majority]==num[i]?count++:count--;
if (count==0)
{
majority=i;
count=1;
}
}
return num[majority];
}
算法的实现
在算法执行过程中,我们使用常量空间实时记录一个候选元素下标majority以及其出现次数count,majority即为当前阶段出现次数超过半数的元素下标。
在遍历开始之前,该元素出现次数为0,count=0。
然后在遍历数组A时,如果count为0,表示当前并没有候选元素,也就是说之前的遍历过程中并没有找到超过半数的元素。那么,如果超过半数的元素存在,那么num[majority]在剩下的子数组中,出现次数也一定超过半数。因此我们可以将原始问题转化为它的子问题。此时majority赋值为当前元素下标, 同时count=1。
如果当前元素num[i] == num[majority], 那么count += 1。(没有找到不同元素,只需要把相同元素累计起来)
如果当前元素num[i] != num[majority], 那么count -= 1。 (相当于删除1个count),不对num[i]做任何处理(相当于删除num[i])
如果遍历结束之后,count不为0,那么元素num[majority]即为寻找的元素。上述算法的时间复杂度为O(n),而由于并不需要真的删除数组元素,我们也并不需要额外的空间来保存原始数组,空间复杂度为O(1)。