(转载自用)leetcode题:搜索插入位置(二分查找法)

changan277

已于 2024-05-11 22:59:40 修改

阅读量43

点赞数

分类专栏： leetcod 文章标签： leetcode 算法排序算法

于 2024-05-11 21:38:49 首次发布

原文链接：https://leetcode.cn/problems/search-insert-position/solutions/1739555/by-xun-ge-v-t1go/

版权

leetcod 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

题目描述:
给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。

请必须使用时间复杂度为 O(log n) 的算法。

示例 1:

输入: nums = [1,3,5,6], target = 5
输出: 2

示例 2:

输入: nums = [1,3,5,6], target = 2
输出: 1

示例 3:

输入: nums = [1,3,5,6], target = 7
输出: 4

提示:

1 <= nums.length <= 104
-104 <= nums[i] <= 104
nums 为 无重复元素 的升序排列数组
-104 <= target <= 104

题解:

查找过程
首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步查找前一子表，否则进一步查找后一子表。重复以上过程，直到找到满足条件的记录，使查找成功，或直到子表不存在为止，此时查找不成功。

边界问题
总结为一句话：左闭左+1，右闭右-1，开区间选mid

说到二分查找相信我们都能说出个一二三，但是每次到写代码时，却总是差一点，最多情况往往是边界不知道怎么取，现在就说一下，二分查找存在的边界问题。

二分查找涉及的很多的边界条件，逻辑比较简单，但就是写不好。相信很多同学都和我一样，在条件判断时总是不知道是 while(left < right) 还是 while(left <= right)，到底是right = mid呢，还是要right = mid - 1呢？

大家写二分法经常写乱，主要是因为对区间的定义没有想清楚，区间的定义就是不变量。要在二分查找的过程中，保持不变量，就是在while寻找中每一次边界的处理都要坚持根据区间的定义来操作，这就是循环不变量规则。

写二分法，区间的定义有以下四种，左闭右闭即[left, right]，或者左闭右开即[left, right)，或者左开右闭即(left, right]，或者左开右开即(left, right)，其中左闭右闭即[left, right]比较常用，基本思路不变只是控制了一些变量选择

下面我用这四种区间的定义分别讲解四种不同的二分写法。

以下分析基于理论情况，实际题目中我们比较常用第一种情况和第二种情况

二分法第一种写法，左闭右闭即[left, right]
第一种写法，我们定义 target 是在一个在左闭右闭的区间里，也就是[left, right] （这个很重要非常重要）。

区间的定义这就决定了二分法的代码应该如何写，因为定义target在[left, right]区间：

while (left <= right) 要使用 <= ，因为left == right是有意义的，所以使用 <=
if (nums[mid] > target) right 要赋值为 mid - 1，因为当前这个nums[mid]一定不是target，那么接下来要查找的左区间结束下标位置就是 mid - 1，因为区间 -1了，所以取不到mid了
if (nums[mid] < target) left 要赋值为 mid +1，因为当前这个nums[mid]一定不是target，那么接下来要查找的右区间结束下标位置就是 mid + 1，因为区间 +1了，所以取不到mid了
if (nums[mid] == target) 找到了我们需要的值，返回下标mid
例如在数组：1,2,3,4,7,9,10中查找元素2

代码如下：（详细注释）

// 版本一
while(left <= right)// 因为left == right的时候，在[left, right]是有效的空间，即相等时可以取到该元素，所以使用 <=
{
int mid = (left + right)/2;
//如果left+right过大，导致和溢出，可以用mid = left + (right - left) / 2,防止溢出left+right
if(nums[mid] > target)
{
right = mid - 1;// target 在左区间，所以[left, mid - 1]
}
else if(nums[mid] < target)
{
left = mid + 1;// target 在右区间，所以[mid + 1, right]
}
else if(nums[mid] == target)
{
return mid;// 数组中找到目标值，直接返回下标
}
}
二分法第二种写法，左闭右开即[left, right)
如果说定义 target 是在一个在左闭右开的区间里，也就是[left, right) ，那么二分法的边界处理方式则截然不同。

while (left < right)，这里使用 < ,因为left == right在区间[left, right)是没有意义的
if (nums[mid] > target) right 更新为 mid，因为当前nums[mid]不等于target，去左区间继续寻找，而寻找区间是左闭右开区间，所以right更新为mid，即：下一个查询区间不会去比较nums[mid]，因为是开区间，所以取不到
if (nums[mid] < target) left 更新为 mid + 1，因为当前nums[mid]不等于target，去右区间继续寻找，而寻找区间是左闭右开区间，所以left更新为mid + 1，即：下一个查询区间不会去比较nums[mid]，因为区间+1了，所以取不到mid了
if (nums[mid] == target) 找到了我们需要的值，返回下标mid
在数组：1,2,3,4,7,9,10中查找元素2，如图所示：（注意和方法一的区别）

代码如下：（详细注释）

// 版本二
while(left < right)// 因为left == right的时候，在[left, right)是无效的空间，即相等时取不到该元素，所以使用 <
{
int mid = (left + right)/2;
//如果left+right过大，导致和溢出，可以用mid = left + (right - left) / 2,防止溢出left+right
if(nums[mid] > target)
{
right = mid;// target 在左区间，所以[left, mid)
}
else if(nums[mid] < target)
{
left = mid + 1;// target 在右区间，所以[mid + 1, right)
}
else if(nums[mid] == target)
{
return mid;// 数组中找到目标值，直接返回下标
}
}
二分法第三种写法，左开右闭即(left, right]
如果说定义 target 是在一个在左开右闭的区间里，也就是(left, right] ，那么二分法的边界处理方式则截然不同。

while (left < right)，这里使用 < ,因为left == right在区间(left, right]是没有意义的
if (nums[mid] > target) right 更新为 mid - 1，因为当前nums[mid]不等于target，去左区间继续寻找，而寻找区间是左开右闭区间，所以right更新为mid - 1，即：下一个查询区间不会去比较nums[mid]，因为区间-1了，所以取不到mid了
if (nums[mid] < target) left 更新为 mid，因为当前nums[mid]不等于target，去右区间继续寻找，而寻找区间是左开右闭区间，所以left更新为mid，即：下一个查询区间不会去比较nums[mid]，因为是开区间，所以取不到
if (nums[mid] == target) 找到了我们需要的值，返回下标mid
在数组：1,2,3,4,7,9,10中查找元素7，如图所示：（注意和方法二的区别）

// 版本三
while(left < right)// 因为left == right的时候，在(left, right]是无效的空间，即相等时取不到该元素，所以使用 <
{
int mid = (left + right)/2;
//如果left+right过大，导致和溢出，可以用mid = left + (right - left) / 2,防止溢出left+right
if(nums[mid] > target)
{
right = mid - 1;// target 在左区间，所以(left, mid]
}
else if(nums[mid] < target)
{
left = mid;// target 在右区间，所以(mid + 1, right]
}
else if(nums[mid] == target)
{
return mid;// 数组中找到目标值，直接返回下标
}
}
二分法第四种写法，左开右开即(left, right)
如果说定义 target 是在一个在左开右开的区间里，也就是(left, right) ，那么二分法的边界处理方式则截然不同。

while (left < right)，这里使用 < ,因为left == right在区间(left, right)是没有意义的
if (nums[mid] > target) right 更新为 mid ，因为当前nums[mid]不等于target，去左区间继续寻找，而寻找区间是左开右闭区间，所以right更新为mid ，即：下一个查询区间不会去比较nums[mid]，因为是开区间，所以取不到
if (nums[mid] < target) left 更新为 mid，因为当前nums[mid]不等于target，去右区间继续寻找，而寻找区间是左开右闭区间，所以left更新为mid，即：下一个查询区间不会去比较nums[mid]，因为是开区间，所以取不到
if (nums[mid] == target) 找到了我们需要的值，返回下标mid
在数组：1,2,3,4,7,9,10中查找元素7，如图所示：（注意和方法三的区别）

// 版本四
while(left < right)// 因为left == right的时候，在(left, right)是无效的空间，即相等时取不到该元素，所以使用 <
{
int mid = (left + right)/2;
//如果left+right过大，导致和溢出，可以用mid = left + (right - left) / 2,防止溢出left+right
if(nums[mid] > target)
{
right = mid;// target 在左区间，所以(left, mid)
}
else if(nums[mid] < target)
{
left = mid;// target 在右区间，所以(mid, right)
}
else if(nums[mid] == target)
{
return mid;// 数组中找到目标值，直接返回下标
}
}
总结
二分法是非常重要的基础算法，为什么会对于二分法都是一看就会，一写就废？

其实主要就是对区间的定义没有理解清楚，在循环中没有始终坚持根据查找区间的定义来做边界处理。

区间的定义就是不变量，那么在循环中坚持根据查找区间的定义来做边界处理，就是循环不变量规则。

代码
//左闭右闭情况

int searchInsert(int* nums, int numsSize, int target) {
int left = 0, right = numsSize - 1, ans = numsSize;
while (left <= right) {
int mid = ((right - left) >> 1) + left;
if (target <= nums[mid]) {
ans = mid;
right = mid - 1;
} else {
left = mid + 1;
}
}
return ans;
}

笔记:该题解答思路是一步步缩短答案ans的范围(ans的值即nums数组中大于target的最小值),若能找到nums[mid]==target则直接返回mid下标,若找不到,则在逐渐缩短的ans范围中,最后得到的ans就是应该target插入的位置,即当left>right时仍未找到等于target的值,说明target应该插入到ans处)

作者：小迅
链接：https://leetcode.cn/problems/search-insert-position/solutions/1739555/by-xun-ge-v-t1go/
来源：力扣（LeetCode）