数组中出现次数超过一半的数字
1、题目
数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。
例如,输入长度为9的数组{1, 2, 3, 2, 2, 2, 5, 4, 2}。由于数字2在数组中出现了5次,超过数组长度的一半,因此输出2。
输入参数:整型数组number[],数组长度length
输出参数:返回出现次数超过length一半的数字,或者是0(即输入参数错误)
2、解题
解这道题的关键在于抓住这种数组的特性,即数组中某个数字出现次数超过数组长度的一半。
根据这种特性,我们可以产生两种思路:
- 若数组是已排序的,则数组的中间元素就是那个数字(出现次数超过数组长度一半)。
- 该数字出现的次数,比其他所有数字出现的次数的和还要多。
因此,这道题目有三种解法,主要介绍解法二和解法三。
解法一:直接将数组排序,再取得数组的中间元素。该解法的时间复杂度为O(nlogn),虽然是最直接的解法,但并非最让人满意的解法。
解法二:利用随机快速排序的思想搜寻数组的中位数。在数组中随机取一个数字,然后调整数组中数字的顺序,将比它小的数字都排在它的左边,比它大的数字都排在它的右边。然后判断该数字是否处于数组的中间位置,即下标是否等于n/2,若相等,则该数字是数组的中位数,即为所寻数字。若下标大于n/2,那么中位数应该位于其左边;若下标小于n/2,那么中位数应该位于其右边。判断结束后,我们缩再小数组的查找范围,进一步搜寻数组的中位数。
解法三:因为所寻数字出现的次数比其他所有数字出现的次数多,所以我们可以统计数组中数字的个数。既然要统计,那我们就进行数组的遍历,在遍历数组的同时保存两个值,一个是数组中的一个数字,另一个是次数times。当我们遍历到下一个数字的时候,如果下一个数字和我们之前保存的数字相同,则次数times加1,如果不同,则times减1,当次数times为零时,我们就保存下一个数字,并把times重新设为1。根据特性,所寻数字肯定是最后一次把次数设置为1时对应的数字。
下面先看解法二、三的代码。
3、代码
首先两种算法都包括共同的两个部分:输入参数的鲁棒性检查,搜寻结果的标准检验,代码如下:
//判断用户输入参数是否正确
bool CheckInvalidArray(int* numbers, int length) {
bool inputInvalid = false;
if (numbers == nullptr || length <= 0)
inputInvalid = true;
return inputInvalid;
}
//判断搜寻到的数字是否满足出现次数超过数组长度一半的条件
bool CheckMoreThanHalf(int* numbers, int length, int number) {
bool isMoreThanHalf = true;
int times = 0;
for (int i = 0; i < length; i++) {
if (numbers[i] == number)
times++;
}
if (times * 2 <= length) {
isMoreThanHalf = false;
}
return isMoreThanHalf;
}
解法二:利用随机快速排序的思想搜寻数组的中位数
int MoreThanHalfNum_Solution2(int numbers[], int length) {
if(CheckInvalidArray(numbers, length)) //鲁棒性检查
return 0;
int start = 0; //start、end指针初始化
int end = length - 1;
int middle = length >> 1; //middle指向数组中间
int index = Partition(numbers, length, start, end); //获取随机选中数字的下标
while (index != middle) { //判断下标的位置,进一步缩小中位数查找范围
if (index > middle) {
end = index - 1;
index = Partition(numbers, length, start, end);
}
else {
start = index + 1;
index = Partition(numbers, length, start, end);
}
}
int number = numbers[index]; //获取中位数,进行结果的标准检验
if (!CheckMoreThanHalf(numbers, length, number))
return 0;
return number; //最后返回结果即可
}
//Partition函数用于实现随机快速排序的一次操作
int Partition(int data[], int length, int start, int end)
{
//鲁棒性检查
if (data == nullptr || length <= 0 || start < 0 || end >= length)
throw new std::exception("Invalid parameters.");
int index = RandomInRange(start, end); //从所给数组范围内随机获取一个数组下标
Swap(&data[index], &data[end]); //将数组元素data[index]与末尾元素data[end]互换
int small = start - 1; //small用于指向已确定小于随机元素的数组区域
//最后一个元素的位置
for (int i = start; i < end; i++) { //循环处理data[end]前面的元素
if (data[i] < data[end]) { //将比data[end]小的元素换到前面
small++;
if (small != i)
Swap(&data[small], &data[i]);
}
}
small++; //最后将末尾元素data[end]换回来
Swap(&data[end], &data[small]);
return small; //返回随机元素的"排序"位置
}
解法三:统计数组中数字的个数
int MoreThanHalfNum_Solution3(int numbers[], int length) {
if (CheckInvalidArray(numbers, length)) //鲁棒性检查
return 0;
int result = numbers[0]; //初始化遍历时应存储的两个值
int times = 1; //数字result和其对应的个数times
for (int i = 1; i < length; i++) { //遍历数组
if (times == 0) { //times为0时,将二者重新设置
result = numbers[i];
times = 1;
}
else if (result == numbers[i]) //若遍历到的元素和result相等,times加1
times++;
else //若遍历到的元素和result不等,times减1
times--;
}
int number = result; //最后一次赋值的result即为所寻结果,进行标准检验
if (!CheckMoreThanHalf(numbers, length, number))
return 0;
return number; //返回结果即可
}
4、两种解法的异同
- 解法二、解法三的时间复杂度都是O(n)
- 解法二改变了输入的数组,而解法三没有改变,在面试的时候,需要和面试官讨论清楚需求
5、注意点
- 输入参数的鲁棒性检查,包括解法二所需的Partition函数
- Partition函数除了可以用在快排中,还可以实现在长度为n的数组中查找第k大的数字
- 测试代码和以上代码略微有所不同,增加了一个全局变量
g_bInputInvalid
判断输入参数的正确性