题意
数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字。
假设数组非空,并且一定存在满足条件的数字。
要求只能使用 O(n) 的时间和额外 O(1) 的空间
样例
输入:[1,2,1,1,3]
输出:1
这是一道非常经典的面试题很多公司的面试官喜欢出这道题目 注意这里的是无序数组
小提示:如果面试题是要求在排序的数组(或者部分排序的数组)中查找一个数字或者统计某个数字出现的次数,我们都可以尝试用『二分查找』算法。
1 第一种解法
是对其进行排序 但是空间复杂度(n*longn)并不是面试馆期望的答案
2第二种解法
一个数字出现的次数大于数组一半那么这个数字出现的次数大于其他所有数字出现的次数因此设计一个计数器和和一个变量记录值
class Solution {
public:
int moreThanHalfNum_Solution(vector<int>& nums) {
int count=0,val=-1;//开始初始化一个任意的数不是数组里的所以次数为0
for(auto x:nums)
{
if(x==val)
count++;//相等的化次数+1
else
{
if(count) count--;//这里用count作为判断不等的花-1
else
{
count=1;//count=0说明互相抵消了下一个数就要记录而且第一数一定和初始化的vax不等所以要这里写成count=1,val=x;
val=x;
}
}
}
return val;
}
};
3第三种解法基于快速快速排序的思想
思路
次数大于数组长度的一半一定是这个数组的中为数
在随机快速排序算法中,我们先在数组中随机选择一个数字,然后调整数组中数字的顺序,使得比选中的数字小数字都排在它的左边,比选中的数字大的数字都排在它的右边。如果这个选中的数字的下标刚好是n/2,那么这个数字就是数组的中位数。如果它的下标大于n/2,那么中位数应该位于它的左边,我们可以接着在它的左边部分的数组中查找。如果它的下标小于n/2,那么中位数应该位于它的右边,我们可以接着在它的右边部分的数组中查找。这是一个典型的递归过程,可以用如下代码实现:
int moreThanHalfNum(int[] array, int length){
if(ChechInvalidArray(array, length)){
return 0;
}
int middle = length >> 1;
int start = 0;
int end = length - 1;
int index = Partition(array, length, start, end);
// 寻找中位数
while(index != middle){
// 如果得到 index 大于中间值,则往前半部分查找
if(index > middle){
end = index - 1;
index = Partition(array, length, start, end);
}else{
start = index + 1;
index = Partition(array, length, start, end);
}
}
int result = array[middle];
if(!CheckMoreThanHalf(array, length, result)){
return 0;
}
return result;
}
求一个无序数组的中位数
要求o(n)的时间找出数组的中位数
这道题目也是一道经典的面试题
一个随机序列,找出序列的中位数,当序列个数为奇数时,为中间位置上的数字;当序列为偶数时,为中间两个数字的平均值。
1、partition法
利用快排关键字的查找方法
a.随机选取一个关键字key,将序列二分;
b.若关键字的下标大于N/2,则继续对序列的左半部分执行partition;
c.若关键字的下标小于N/2,则继续对序列的左半部分执行partition;
d.若关键字的下标等于N/2,则返回key。
这种算法:partition的时间复杂度为O(n),获取中位数的时间复杂度为O(1)。
2、利用平衡二叉查找树
每读取一个数字,将数字插入到二叉树中,并调整二叉树的平衡性。最后根节点就是想要的中位数。
构建平衡二叉查找树的算法时间复杂度为O(logn),取出中位数的时间复杂度为O(n)。但是调整平衡二叉查找树算法实现比较复杂。
3.利用堆
原理分析:中位数无非就是将序列分为两个部分,左边的部分都小于中位数,右边的序列都大于中位数。这比较符合堆的特性(看看数据结构在算法中的重要性,选择好的数据结构能够让算法事半功倍)。可以将序列分成两个部分,左边的部分够着大根堆,右边的部分构造小根堆。
具体实现细节:
a.如果堆中元素的个数为偶数时,将新数字插入小根堆中(插入后堆元素的个数为奇数,此时结束插入,返回小根堆堆顶元素);如果堆中的元素个数为奇数时,将新数字插入大根堆中(插入后堆元素的个数为偶数,此时结束插入,返回两堆堆顶元素的均值)。
b.若插入小根堆的元素大于大根堆堆顶的元素,说明新元素位于序列的右半部分,应当插入大根堆。而此时大根堆堆顶元素应当位于左半序列(小顶堆)中,因此需要将大根堆堆顶元素插入小根堆。若插入若插入小顶堆的元素不大于大顶堆堆顶的元素,则直接插入小根堆。
c.同理,向大根堆插入元素时也有如上考虑。