题目描述:
数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。例如输入一个长度为9的数组{1,2,3,2,2,2,5,4,2}。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。如果不存在则输出0。
解题思路:
方法一:
数组中某个数字出现的次数超过了数组长度的一半,我们把它叫做众数;如果将数组排序,众数必然出现在数组索引为middle = numbers.size() >> 1的位置;所以想到对数组进行排序,排序算法中最常用的就是复杂度O(nlogn)的快速排序算法,排序算法的核心操作(partion)就是随机选择数组中的一个数值元素作为分界值,将小于该数值的元素放在它的左边,将不小于该数值的元素放在它的右边;如果随机选择的这个数值元素出现的位置恰好在middle位置,那么该数值则为众数(因为它的其那面的数组元素比它小,后面的数组元素不小于它,并且它恰好在数组中间位置,它就是这个数组的中位数,也是众数);如果随机选择的这个数值元素出现的位置大于middle位置,那么众数在该数值元素的前面,对该位置之前的元素再进行一次partion;如果随机选择的这个数值元素出现的位置小于middle位置,那么众数在该数值元素的后面,对该位置之后的元素再进行一次partion;类似于二分查找,直到随机选择的数值元素出现的位置等于middle位置。
方法二:
首先设置两个辅助变量,result保存数组中的一个元素值,初始为数组的第一个元素,cout表示次数,初始为1,表示result出现了一次;接下来遍历数组,如果下一个元素与result相等,则将cout 加1,如果不等则将cout减一,当cout为零时,将当前位置的数字元素保存到result中,并将cout设置为1,表示该数字出现了一次;遍历数组结束,最后一次使cout为零时对应的元素就是众数的数值,及此时result中的数值。
为什么???当遍历数组到最后一次使cout为零对应的元素时,前面的众数数值元素与非众数值元素出现了相同的次数,才能使cout为零;如果此刻的元素不是众数,则cout必将再次为零,因为该位置之后的众数元素个数大于非众数元素个数,所以与最后一次使cout为零这个前提条件矛盾,所以它必然是众数。
注意事项:
1)判断输入数组是否为空,是否存在众数;
2)方法一移动了输入数组部分元素的位置,方法二则没有;时间复杂度方面,两种方法都是O(n)的,方法一的时间复杂度说明参见《算法导论》相关章节;由此可见推荐使用方法二。
通过代码(c++):
方法一:
#include<iostream>
#include<random>
class Solution {
public:
int MoreThanHalfNum_Solution(vector<int> numbers) {
if(numbers.empty())
return 0;
int middle = numbers.size() >> 1;
int start = 0;
int end = numbers.size() - 1;
int index = partion(numbers,start,end);
if(index < 0)
return 0;
while(index != middle)
{
if(index > middle)
{
end = index-1;
}
else
{
start = index+1;
}
index = partion(numbers,start,end);
}
//判断输入是否存在超过数组长度一半的数
int result = numbers[index];
if(!checkMoreThanHalf(numbers,result))
return 0;
return result;
}
//快速排序的基础,返回选中的基准值在数组中的位置
int partion(vector<int>&numbers, int start, int end)
{
int len = numbers.size();
if(numbers.empty() || start < 0 || end >= len)
return -1;
//产生start-end的随机数
int index = RandomInRange(start,end);
swap(numbers[index],numbers[end]);
int small = start - 1;
for(index = start; index < end; ++index)
{
if(numbers[index] < numbers[end])
{
++small;
if(small != index)
swap(numbers[small],numbers[index]);
}
}
++small;
swap(numbers[small],numbers[end]);
return small;
}
//产生[start,end]的随机数
int RandomInRange(int start,int end)
{
std::mt19937 rng;//随机数类型
rng.seed(std::random_device()());//初始化随机数种子
//创建一个均匀分布,这个均匀分布可以等概率(随机)生成[start,end]区间的整形数字;
std::uniform_int_distribution<int> dist(start,end);
return dist(rng);
}
//判断输入是否存在超过数组长度一半的数
bool checkMoreThanHalf(vector<int>&numbers,int result)
{
int cout = 0;
int len = numbers.size();
for(int i=0; i<len; ++i)
{
if(numbers[i] == result)
cout++;
}
if(cout * 2 > len)
return true;
return false;
}
};
方法二:
#include<iostream>
#include<random>
class Solution {
public:
int MoreThanHalfNum_Solution(vector<int> numbers) {
if(numbers.empty())
return 0;
int result = numbers[0];
int len = numbers.size();
int cout = 1;
for(int i = 0; i < len-1; ++i)
{
if(numbers[i+1] == numbers[i])
{
cout++;
}
else
{
cout--;
if(cout == 0)
{
result = numbers[i+1];
cout = 1;
}
}
}
//判断输入是否存在超过数组长度一半的数
if(!checkMoreThanHalf(numbers,result))
return 0;
return result;
}
//判断输入是否存在超过数组长度一半的数
bool checkMoreThanHalf(vector<int>&numbers,int result)
{
int cout = 0;
int len = numbers.size();
for(int i=0; i<len; ++i)
{
if(numbers[i] == result)
cout++;
}
if(cout * 2 > len)
return true;
return false;
}
};