1、题目:统计一个数字在排序数组中出现的次数。
例如输入排序数组{1,2,3,3,3,3,4,5}和数字3,由于3在这个数组中出现了4次,因此输出4。
既然数组是有序的,自然想到用二分查找。因为要查找的数字在长度为n的数组中有可能出现O(n)次,所以顺序扫描的时间复杂度是O(n)。
解法:
假设统计数字k在排序数组中出现的次数,前面的二分查找中主要消耗在如何确定重复出现的数字的第一个k和最后一个k的位置上。二分查找总是先拿数组中间的数字和k做比较。如果中间的数字比k大,那么k只有可能出现在数组的前半段,下一轮查找在前半段进行即可。若中间数字比k小,则后半段。
若相等,需要先判断这个数字是不是第一个k。如果位于中间数字的前面一个数字不是k,此时中间的数字刚好是第一个k。如果中间数字的前面一个数字也是k,也就是说第一个k肯定在数组的前半段,下一轮仍需要在前半段查找。
1)递归代码找到排序数组中第一个k:
int GetFirstK(int* data, int length, int k, int start, inr end)
{
if(start > end)
return -1;
int middleIndex = (start + end) / 2;
int middleData = data[middleIndex];
if(middleData == k)
{
if((middleIndex > 0 && data[middleIndex - 1] != k)
|| middleIndex == 0)
return middleIndex;
else
end = middleIndex - 1;
}
else if(middleData > k)
end = middleIndex - 1;
else
start = middleIndex + 1;
return GetFirstK(data, length, k, start, end);
}
在函数GetFirstK中,如果数组中不包含数字k,返回-1。如果数组中包含至少一个k,那么返回第一个k在数组中的下标。
2)我们可以用同样的思路在排序数组中找到最后一个k。
int GetLastK(int* data, int length, int k, int start, inr end)
{
if(start > end)
return -1;
int middleIndex = (start + end) / 2;
int middleData = data[middleIndex];
if(middleData == k)
{
if((middleIndex < length - 1 && data[middleIndex + 1] != k)
|| middleIndex == length - 1)
return middleIndex;
else
start = middleIndex + 1;
}
else if(middleData < k)
start = middleIndex + 1;
else
end = middleIndex - 1;
return GetLastK(data, length, k, start, end);
}
3)在分别找到第一个k和最后一个k的下标之后,就能计算出k在数组中出现的次数了。
int GetNumberOfK(int* data, int length, int k)
{
int number = 0;
if(data != NULL && length > 0)
{
int first = GetFirstK(data, length, k, 0, length - 1);
int last = GetLastK(data, length, k, 0, length - 1);
if(first > -1 && last > -1)
number = last - first + 1;
}
return number;
}
上述代码中,GetFirstK和GetLastK都是用二分查找,时间复杂度都是O(logn),因此总时间复杂度也只有O(logn)。