二分查找是一种在有序数组中查找某一特定元素的搜索算法 。
问题:在一个有序的数组中查找具体的某个数字n
例如:数组arr[]={1,2,3,4,5,6,7,8,9,10},在这样的一个有序数组中如何找到元素7,并打印出它的下标
一种非常简单的方法:我们可以一个一个去比对,从数组的首元素开始,一一对比看它是否等于7
最多只用比对10次,可是如果有100个元素甚至上万个元素还要去一一对比吗,显然这样代码的效
率太低;
这种一一对比方法的实现如下:
#include<stdio.h>
int main()
{
int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
int sz = sizeof(arr) / sizeof(arr[0]); //计算数组元素的个数
int i = 0;
int k = 7;
for (i = 0; i < sz; i++)
{
if (arr[i] == k)
{
printf("找到了,下标是%d\n", i);
break;
}
}
return 0;
}
当然我们可以使用二分查找的方法来实现,具体思路就是:先找到这个数组的首元素arr[left](left=0),尾元素arr[right](right=sz-1,sz是数组元素的个数),求出中间元素的下标mid,用中间元素去和7比较,如果arr[mid]<7,说明7在arr[mid]的右侧,此时需要将left右移,left=mid+1,right不变,求出新的mid继续对比;如果arr[mid]>7,说明7在arr[mid]的左侧,此时需要将right左移,right=mid-1,left不变,求出新的mid继续对比;直到arr[mid]==7,就跳出此循环;一旦left>right时就说明这个元素不在此数组中,找不到了
具体实现如下:
#include<stdio.h>
int main()
{
//在一个有序数组中查找具体的某个数字n
int arr[10] = { 1,2,3,4,5,6,7,8,9,10 };
int sz = sizeof(arr) / sizeof(arr[0]);
int k = 7;
int mid = 0;
int left = 0;
int right = sz - 1;
while (left <= right)
{
mid = (left + right) / 2;
if (arr[mid] < k)
{
left = mid + 1;
}
else if (arr[mid] > k)
{
right = mid - 1;
}
else
{
printf("找到了,下标是%d\n", mid);
break;
}
}
if (left > right)
{
printf("找不到\n");
}
return 0;
}
详细的图解如下:
最后总结一下两个关键点:
1. while(), 括号中的进入循环条件要写成,left<=right,一定要有=;
2.mid的值一定要放在while循环里面求解
同时这里还存在一个小问题,如果查找的数组中数字太多,mid的求解可能会存在数据溢出现象
mid求解可以改成mid=left+(right-left)/2;
#include<stdio.h>
int main()
{
int arr[] = { 1,2,3,4,5,6,7,8,9,10 };
int sz = sizeof(arr) / sizeof(arr[0]);
int k = 7;
int left = 0;
int right = sz - 1;
while (left <= right)
{
//int mid = (left + right) / 2; //可能会存在溢出
int mid = left + (right - left) / 2;
if(arr[mid] < k)
{
left = mid + 1;
}
else if (arr[mid] > k)
{
right = mid - 1;
}
else
{
printf("找到了,下标是%d", mid);
break;
}
}
if (left > right)
{
printf("找不到\n");
}
return 0;
}
在写一种用函数来二分查找的方法:
思路都是相同的,只是把二分查找的过程放在函数内部进行
int binary_search(int arr[], int sz, int k)
{
int left = 0;
int right = sz - 1;
while (left <= right)
{
int mid = left + (right - left) / 2;
if (arr[mid] < k)
{
left = mid + 1;
}
else if (arr[mid] > k)
{
right = mid - 1;
}
else
{
return mid; //找到了返回下标
}
}
return -1; //找不到
}
#include<stdio.h>
int main()
{
int arr[] = { 1,2,3,4,5,6,7,8,9,10 };
int k = 7;
int sz = sizeof(arr) / sizeof(arr[0]);
int ret = binary_search(arr, sz, k);
if (ret == -1)
{
printf("找不到\n");
}
else
{
printf("找到了,下标是%d\n",ret);
}
}
这里需要注意的几点:
1这里尽量把查找的过程放在函数的内部,查找完后的返回情况放在主函数里,这样就保证了函数功能的单一性
2如果找到了就返回这个数组元素的下标;如果找不到,不能随便想一个数返回去,否则可能将和数组元素的下标冲突(比如找到数组元素下标为0返回0,找不到返回0,那么这个0到底是代表数组元素的下标还是代表找不到,这二者之间有冲突),那么这里的返回值就可以是比数组元素下标小的数字(比0小),这里我返回-1,代表找不到
3这是最关键的一点也是最坑的一点,如果这一点写错了,那么整个代码将变得无意义;就是函数在传参的时候要传递数组元素的个数,并且数组元素个数的计算一定要放在主函数里面。因为数组传参实际上传递的是数组首元素的地址,而不是整个数组,int binary_search(int arr[], int k) 形参arr看上去是数组,本质是指针变量。
下面是错误示范:
int binary_search(int arr[], int k)//形参arr看上去是数组,本质是指针变量
{
int sz = sizeof(arr) / sizeof(arr[0]);
int left = 0;
int right = sz - 1;
while (left <= right)
{
int mid = left + (right - left) / 2;
if (arr[mid] < k)
{
left = mid + 1;
}
else if (arr[mid] > k)
{
right = mid - 1;
}
else
{
return mid;//找到了返回下标
}
}
return -1;//找不到
}
#include<stdio.h>
int main()
{
int arr[] = { 1,2,3,4,5,6,7,8,9,10 };
// 0 1 2 3 4 5 6 7 8 9
int k = 7;
//找到了,返回下标
//找不到,返回-1
int ret = binary_search(arr, k);
if (ret == -1)
{
printf("找不到\n");
}
else
{
printf("找到了,下标是:%d\n", ret);
}
return 0;
}
错误原因:一个指针变量的大小为4或8个字节,除以一个整型变量的大小结果是1或2,表明这个数组有1个或2个元素,这里数组元素的个数计算错误,所以数组元素个数的计算要放在主函数里,并且传参的时候要传递数组元素的个数。