1.前言
1.1主要思想
分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问题的答案。
用自己的话来说,就是将一个复杂的或者规模比较大的问题切分为一个个的小问题,不断重复这个过程,直到切分后的小问题瞄一眼就能解决了就退出递归,准备“出栈”。而出栈的过程需要不断解决一个个小问题,最终合并小问题的解来解出最开始的问题。
1.2解题套路
- 找到递归出口。一般是数组只有一个元素后不再往深递归。
- 分:不断切分问题为子问题,即不断往深递归的过程。
- 治:解决子问题,获得子问题的答案。
- 合:合并子问题的解,从而得到原问题的解。
1.3栗子设置
参加的Datawhale组队学习提供了三道题,分别是求数组的众数、求最大的连续子序和和实现 pow(x, n) ,即计算 x 的 n 次幂函数。,接一下会一一分享用分治法如何实现效率的提高,拭目以待哦。如果学有余力的话,可以看一下这道题,数组中的逆序对,希望看完这篇博客你能有所收获,最后请别忘了给我一个小小的鼓励,(不求三连,只求点赞)。
2.要吃的栗子
2.1求数组的众数
给定一个大小为 n 的数组,找到其中的多数元素。多数元素是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。你可以假设数组是非空的,并且给定的数组总是存在多数元素。
思路:这次我们就别用暴力法了,学会了法术[分治法]就准备施展吧。原数组可以被平均分为两个数组,两个数组可以继续分,分到最后的话只剩一个元素这是众数就显而易见了,然后再出递归栈(别忘了递归其实和栈结构类似哦,先调用的方法最后才出结果)。两个小数组的众数又可以合并来提供更大数组的众数,慢慢地,原数组的众数也就冒出泡来。合并的过程中,左右区间提供的众数相同,则左右区间合起来的众数也是这个众数,若不相同,则将左右区间合起来再统计是谁更多。
请看代码:
from typing import List
class Solution:
# 使用分治法,将一个大的问题变成几个很好解决的小问题,再合并小问题的解获得大问题的解
# 很好解决的小问题——在该题就是一个数的众数就是本身,这也是递归的出口
def majorityElement(self, nums: List[int]) -> int:
# 1.递归出口
if len(nums) == 1:
return nums[0]
# 2.分解为解方法相同的子问题
left = self.majorityElement(nums[:len(nums)// 2]) # 左区间的众数
right = self.majorityElement(nums[len(nums)// 2:]) # 右区间的众数
# 3.判断众数,求解子问题。包括合并子问题的解
if left == right: # 左右区间提供的众数相同,则左右区间合起来的众数也是这个众数
return left
if nums.count(left) > nums.count(right): # 若不相同,则将左右区间合起来再统计是谁更多
return left
else:
return right # =和<时,返回right做众数,括号中详细讨论=时为什么拿right做众数
# (其实=的时候取right或者left都可。假设再出递归栈一层,若旁边区间也出该众数,毋庸置疑,该众数实至名归,75%的支持率。
# 若不相同,则通过计数比较此时整个区间两个众数候选人谁才是王者)
2.2求最大的连续子序和
给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。
思路:最大子序和可能出现在三种情况下,第一二种,就是左/右区间的最大子序和,三是最大子序列序列飞越了左区间,也包括右区间的部分。对于第三种情况。需要从右往左遍历左区间求包括左区间尾数的最大子序列和,右区间的遍历方式相反,这样才能"合龙"(两个子序列才能连续,求和)。最终合并这三种情况的解,按要求取其中最大的值作为整个数组的最大子序和。按套路,我们先将不断递归使数组长度变为1,此时的子序和即数组中的唯一的那个数(得到显而易见的解)…接下来请看代码。
from typing import List
class Solution:
def maxSubArray(self, nums: List[int]) -> int:
# 1.找递归出口
if len(nums) == 1:
return nums[0]
# 2.切分原问题为子问题
left = self.maxSubArray(nums[:len(nums) // 2]) # 左区间的最大子序和
right = self.maxSubArray(nums[len(nums) // 2:]) # 右区间的最大子序和
# 3.求解子问题
# 最大子序和可能出现在三种情况下,第一二种,就是左/右区间的最大子序和,三是最大子序列序列飞越了左区间,也包括右区间的部分
# 第三种情况:从右往左遍历左区间求包括左区间尾数的最大子序列和,右区间的遍历方式相反,这样才能"合龙"(两个子序列才能连续,求和)
# (1).从右往左遍历
max_l = nums[len(nums) // 2 - 1] # 记录包括左区间尾数的最大子序列和,初始化为左区间尾数
temp = 0 # 记录相加过程中的序列和
for i in range(len(nums) // 2 - 1, -1,-1): # range(start, stop[, step]),step默认为1,此时应设为-1
temp += nums[i]
max_l = max(temp, max_l)
# (2)从左往右遍历
max_r = nums[len(nums) // 2] # 记录包括右区间第一个数的最大子序列和,初始化为左区间第一个数
temp = 0 # 记录相加过程中的序列和
for i in range(len(nums) // 2, len(nums)):
temp += nums[i]
max_r = max(temp, max_r)
# 4.合并子问题的解,获得原问题的解
return max(left, right, max_l + max_r)
我发现,上面两题给我们两个其实,其实分治法的第一二部(找递归出口和递归划分数组)简直就是一模一样,哈哈,完美的套路。
这里有一份Java动态规划[我觉得就像在遍历的过程中填表]实现该题的代码,可以康康。可以跳过这段。
class Solution {
public int maxSubArray(int[] nums) {
/*动态规划第一种方法
int arrayLen = nums.length;//获取数组长度
if (arrayLen == 0) {//长度为0,返回最大子序和为0
return 0;
}
int result = nums[0];//返回值初始化为nums[0]
for (int i = 1; i < arrayLen; i++) {
if (nums[i - 1] > 0) {//自立门户还是跟着大部队,若大部队大于0就乐观认为可能找到更大的子序列
nums[i] += nums[i - 1];
}
if (nums[i] > result)//记录当下标签指的位置的最大子序列,与历史最大子序列相比
result = nums[i];
}
return result;*/
//动态规划第二种方法
int arrayLen = nums.length;//获取数组长度
if (arrayLen == 0) {//长度为0,返回最大子序和为0
return 0;
}
int result=nums[0];//返回值初始化为nums[0]
int xxx=nums[0];//过程序列的值
for (int i = 1; i < arrayLen; i++) {
xxx = Math.max(xxx+nums[i],nums[i]);//自立门户还是跟在大部队后头取决于大部队和自身的资源多少
result = Math.max(xxx,result);//更新最大子序和
}
return result;
}
}
那么,老哥,趁热打铁,再来一题?
2.3求最大的连续子序和
实现 pow(x, n) ,即计算 x 的 n 次幂函数。
思路:
- 首先对x和n进行预处理,若n<0,将n变为正数,再进行分治法
- 设置递归出口
- 切分原问题形成子问题。将幂不断除以2或者-1,可以到达递归出口n==0
- 求解子问题后合并子问题的解
代码如下:
class Solution:
# 计算 x 的 n 次幂函数,不使用内置函数
def myPow(self, x: float, n: int) -> float:
# 1.预处理,幂n为负数,转换为正数计算
if n < 0:
x = 1 / x # 自变量变为倒数
n = -n # 幂变为相反数,如5^(-1)=(1/5)^1
# 2.设置递归出口
if n == 0:
return 1
# 3.原问题切分产生子问题,求解子问题
if n % 2 == 1: # 合并子问题的解
p = x * self.myPow(x, n - 1)
return p
# 不断切分
return self.myPow(x * x, n / 2)
3.饭后甜点
归并排序和快速排序都是分治法的应用,与其说分治法是一种算法,不如说分治法是一种思想或者一种策略,将原问题划分为容易求解的子问题,再合并子问题的解获得原问题的解。分治法的时间复杂度大致为o(n)。
归并排序算法会把序列分成长度相同的两个子序列,当无法继续往下分时(也就是每个子序列中只有一个数据时),就对子序列进行归并。归并指的是把两个排好序的子序列合并成一个有序序列。该操作会一直重复执行,直到所有子序列都归并为一个整体为止。时间复杂度为o(nlogn)
个人感觉题要多练才会对某种编程思想敏感,让我们一起加油。
4.参考资料
- datawhalechina/team-learning-program
- 我的第一本算法书-[日]石田保辉 宫崎修一/著 张贝/译