Datawhale Task1-分治算法-梳理总结

最新推荐文章于 2021-08-22 19:58:32 发布

呼啸蓝天

最新推荐文章于 2021-08-22 19:58:32 发布

阅读量150

点赞数

分类专栏： lettcode 文章标签：编程语言算法

本文链接：https://blog.csdn.net/m0_37166734/article/details/108101041

版权

lettcode 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

分治算法

1.前言

1.1主要思想

分治算法的主要思想是将原问题递归地分成若干个子问题，直到子问题满足边界条件，停止递归。将子问题逐个击破(一般是同种方法)，将已经解决的子问题合并，最后，算法会层层合并得到原问题的答案。

用自己的话来说，就是将一个复杂的或者规模比较大的问题切分为一个个的小问题，不断重复这个过程，直到切分后的小问题瞄一眼就能解决了就退出递归，准备“出栈”。而出栈的过程需要不断解决一个个小问题，最终合并小问题的解来解出最开始的问题。

1.2解题套路

找到递归出口。一般是数组只有一个元素后不再往深递归。
分：不断切分问题为子问题，即不断往深递归的过程。
治：解决子问题，获得子问题的答案。
合：合并子问题的解，从而得到原问题的解。

1.3栗子设置

参加的Datawhale组队学习提供了三道题，分别是求数组的众数、求最大的连续子序和和实现 pow(x, n) ，即计算 x 的 n 次幂函数。，接一下会一一分享用分治法如何实现效率的提高，拭目以待哦。如果学有余力的话，可以看一下这道题，数组中的逆序对，希望看完这篇博客你能有所收获，最后请别忘了给我一个小小的鼓励，（不求三连，只求点赞）。

2.要吃的栗子

2.1求数组的众数

给定一个大小为 n 的数组，找到其中的多数元素。多数元素是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。你可以假设数组是非空的，并且给定的数组总是存在多数元素。

思路:这次我们就别用暴力法了，学会了法术[分治法]就准备施展吧。原数组可以被平均分为两个数组，两个数组可以继续分，分到最后的话只剩一个元素这是众数就显而易见了，然后再出递归栈（别忘了递归其实和栈结构类似哦，先调用的方法最后才出结果）。两个小数组的众数又可以合并来提供更大数组的众数，慢慢地，原数组的众数也就冒出泡来。合并的过程中，左右区间提供的众数相同，则左右区间合起来的众数也是这个众数，若不相同，则将左右区间合起来再统计是谁更多。
请看代码：

from typing import List

class Solution:
    # 使用分治法，将一个大的问题变成几个很好解决的小问题，再合并小问题的解获得大问题的解
    # 很好解决的小问题——在该题就是一个数的众数就是本身，这也是递归的出口
    def majorityElement(self, nums: List[int]) -> int:

        # 1.递归出口
        if len(nums) == 1:
            return nums[0]

        # 2.分解为解方法相同的子问题
        left = self.majorityElement(nums[:len(nums)// 2])  # 左区间的众数
        right = self.majorityElement(nums[len(nums)// 2:])  # 右区间的众数

        # 3.判断众数，求解子问题。包括合并子问题的解
        if left == right:  # 左右区间提供的众数相同，则左右区间合起来的众数也是这个众数
            return left
        if nums.count(left) > nums.count(right):  # 若不相同，则将左右区间合起来再统计是谁更多
            return left
        else:
            return right  # =和<时，返回right做众数，括号中详细讨论=时为什么拿right做众数
            # （其实=的时候取right或者left都可。假设再出递归栈一层，若旁边区间也出该众数，毋庸置疑，该众数实至名归，75%的支持率。
            # 若不相同，则通过计数比较此时整个区间两个众数候选人谁才是王者）

2.2求最大的连续子序和

给定一个整数数组 nums ，找到一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。

思路:最大子序和可能出现在三种情况下，第一二种，就是左/右区间的最大子序和，三是最大子序列序列飞越了左区间，也包括右区间的部分。对于第三种情况。需要从右往左遍历左区间求包括左区间尾数的最大子序列和，右区间的遍历方式相反，这样才能"合龙"（两个子序列才能连续，求和）。最终合并这三种情况的解，按要求取其中最大的值作为整个数组的最大子序和。按套路，我们先将不断递归使数组长度变为1，此时的子序和即数组中的唯一的那个数（得到显而易见的解）…接下来请看代码。

from typing import List

class Solution:
    def maxSubArray(self, nums: List[int]) -> int:
        # 1.找递归出口
        if len(nums) == 1:
            return nums[0]

        # 2.切分原问题为子问题
        left = self.maxSubArray(nums[:len(nums) // 2])  # 左区间的最大子序和
        right = self.maxSubArray(nums[len(nums) // 2:])  # 右区间的最大子序和

        # 3.求解子问题
        # 最大子序和可能出现在三种情况下，第一二种，就是左/右区间的最大子序和，三是最大子序列序列飞越了左区间，也包括右区间的部分
        # 第三种情况：从右往左遍历左区间求包括左区间尾数的最大子序列和，右区间的遍历方式相反，这样才能"合龙"（两个子序列才能连续，求和）
        # (1).从右往左遍历
        max_l = nums[len(nums) // 2 - 1]  # 记录包括左区间尾数的最大子序列和，初始化为左区间尾数
        temp = 0  # 记录相加过程中的序列和
        for i in range(len(nums) // 2 - 1, -1,-1):  # range(start, stop[, step])，step默认为1，此时应设为-1
            temp += nums[i]
            max_l = max(temp, max_l)
        # (2)从左往右遍历
        max_r = nums[len(nums) // 2]  # 记录包括右区间第一个数的最大子序列和，初始化为左区间第一个数
        temp = 0  # 记录相加过程中的序列和
        for i in range(len(nums) // 2, len(nums)):
            temp += nums[i]
            max_r = max(temp, max_r)

        # 4.合并子问题的解，获得原问题的解
        return max(left, right, max_l + max_r)

我发现，上面两题给我们两个其实，其实分治法的第一二部（找递归出口和递归划分数组）简直就是一模一样，哈哈，完美的套路。
这里有一份Java动态规划[我觉得就像在遍历的过程中填表]实现该题的代码，可以康康。可以跳过这段。

class Solution {
    public int maxSubArray(int[] nums) {
        /*动态规划第一种方法
        int arrayLen = nums.length;//获取数组长度
        if (arrayLen == 0) {//长度为0，返回最大子序和为0
            return 0;
        }
        int result = nums[0];//返回值初始化为nums[0]
        for (int i = 1; i < arrayLen; i++) {
            if (nums[i - 1] > 0) {//自立门户还是跟着大部队，若大部队大于0就乐观认为可能找到更大的子序列
                nums[i] += nums[i - 1];
            }
            if (nums[i] > result)//记录当下标签指的位置的最大子序列，与历史最大子序列相比
                result = nums[i];
        }
        return result;*/
        //动态规划第二种方法
        int arrayLen = nums.length;//获取数组长度
        if (arrayLen == 0) {//长度为0，返回最大子序和为0
            return 0;
        }
        int result=nums[0];//返回值初始化为nums[0]
        int xxx=nums[0];//过程序列的值
        for (int i = 1; i < arrayLen; i++) {
            xxx = Math.max(xxx+nums[i],nums[i]);//自立门户还是跟在大部队后头取决于大部队和自身的资源多少
            result = Math.max(xxx,result);//更新最大子序和
        }
        return result;
    }
}

那么，老哥，趁热打铁，再来一题？

2.3求最大的连续子序和

实现 pow(x, n) ，即计算 x 的 n 次幂函数。

思路：

首先对x和n进行预处理，若n<0，将n变为正数，再进行分治法
设置递归出口
切分原问题形成子问题。将幂不断除以2或者-1，可以到达递归出口n==0
求解子问题后合并子问题的解
代码如下：

class Solution:
    # 计算 x 的 n 次幂函数，不使用内置函数
    def myPow(self, x: float, n: int) -> float:
        # 1.预处理，幂n为负数，转换为正数计算
        if n < 0:
            x = 1 / x  # 自变量变为倒数
            n = -n  # 幂变为相反数，如5^(-1)=(1/5)^1

        # 2.设置递归出口
        if n == 0:
            return 1

        # 3.原问题切分产生子问题，求解子问题
        if n % 2 == 1:  # 合并子问题的解
            p = x * self.myPow(x, n - 1)
            return p
        # 不断切分
        return self.myPow(x * x, n / 2)

3.饭后甜点

归并排序和快速排序都是分治法的应用，与其说分治法是一种算法，不如说分治法是一种思想或者一种策略，将原问题划分为容易求解的子问题，再合并子问题的解获得原问题的解。分治法的时间复杂度大致为o(n)。

归并排序算法会把序列分成长度相同的两个子序列，当无法继续往下分时（也就是每个子序列中只有一个数据时），就对子序列进行归并。归并指的是把两个排好序的子序列合并成一个有序序列。该操作会一直重复执行，直到所有子序列都归并为一个整体为止。时间复杂度为o(nlogn)

个人感觉题要多练才会对某种编程思想敏感，让我们一起加油。

4.参考资料

datawhalechina/team-learning-program
我的第一本算法书-[日]石田保辉宫崎修一/著张贝/译

呼啸蓝天

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Datawhale Task1-分治算法-梳理总结

1.前言1.1主要思想分治算法的主要思想是将原问题递归地分成若干个子问题，直到子问题满足边界条件，停止递归。将子问题逐个击破(一般是同种方法)，将已经解决的子问题合并，最后，算法会层层合并得到原问题的答案。用自己的话来说，就是将一个复杂的或者规模比较大的问题切分为一个个的小问题，不断重复这个过程，直到切分后的小问题瞄一眼就能解决了就退出递归，准备“出栈”。而出栈的过程需要不断解决一个个小问题，最终合并小问题的解来解出最开始的问题。1.2解题套路找到递归出口。一般是数组只有一个元素后不再往深递
复制链接

扫一扫