LeetCode 第 188 题:买卖股票的最佳时机 IV(动态规划)

地址:https://leetcode-cn.com/problems/best-time-to-buy-and-sell-stock-iv

第 1 步:状态定义

dp[i][j][K] :表示到第 i 天为止,已经交易了 j 次,并且当前持股状态为 K 的最大收益

说明:

  • 到第 i 天为止(从 0 开始计算,到 len - 1 ),考虑的区间是 [0, i],这里 len 为数组 prices 的长度;
  • 已经交易了 j 次,j0 开始计算,到 k - 1 为止;
  • 持股状态 K (大写)只有 2 个值:010 表示不持股,1 表示持股,为了与 k 区分,因此使用 K(大写)。

第 2 步:状态转移方程

下面考虑 dp[i][j][0]dp[i][j][1] 可以怎样转移过来。

动态规划用于解决多阶段的决策问题,这里的阶段就是每一天,因此,状态都是从前一天的某一个之前的状态转移过来。

  • dp[i][j][0]:表示这一天发生了第 j 次交易,并且不持股。

特别说明一下:发生交易的标志是在某一天,发生一次购买股票的行为,即发生一次交易。

分类讨论的依据是:昨天是否持股。
(1)昨天不持股,今天还不持股,说明没有发生新的交易;
(2)昨天持股,今天不持股,说明这次交易结束了。这两种情况都在一次交易里。

二者取最大值,即:

dp[i][j][0] = max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i])

注意:中间的那个表示交易次数的状态都是 j

  • dp[i][j][1]:表示这一天已经交易了 j 次,并且持股。

分类讨论的依据依然是:昨天是否持股。

(1)昨天持股,今天还持股,说明没有发生新的交易,这两天在同一个交易区间里;
(2)昨天不持股,今天持股,说明开启了一次新的交易。

二者取最大值,即:

dp[i][j][1] = max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i])

第 3 步: 初始化

  • 所有持股的状态值都设置为一个很大的负数(至少应该是最大的股价的负数 - 1),表示未知,不持股的时候,状态值为 0;
  • 这里 ij 下标都有 -1 ,所以 ij 可以多设置一行,以避免复杂的分类讨论。以下只展示不多设置一行的代码。多设置一行的代码留给读者完成。

第 4 步:输出

最后一个阶段的最后一个状态,且是不持股的那个状态,即 dp[len - 1][k - 1][0]ij 不多设置一行的时候)。

第 5 步:考虑状态压缩

注意到两个状态转移方程,当前行只依赖上一行,并且 j 只依赖 j - 1,但是是另一张表的状态值,因此直接砍掉第一维即可。

先写出没有考虑状态压缩的版本。

Java 代码:

public class Solution {

    public int maxProfit(int k, int[] prices) {
        int len = prices.length;
        // 特判
        if (k == 0 || len < 2) {
            return 0;
        }
        if (k >= len / 2) {
            return greedy(prices, len);
        }

        // dp[i][j][K]:到下标为 i 的天数为止(从 0 开始),到下标为 j 的交易次数(从 0 开始)
        // 状态为 K 的最大利润,K = 0 表示不持股,K = 1 表示持股
        int[][][] dp = new int[len][k][2];

        // 初始化:把持股的部分都设置为一个较大的负值
        for (int i = 0; i < len; i++) {
            for (int j = 0; j < k; j++) {
                dp[i][j][1] = -9999;
            }
        }

        // 编写正确代码的方法:对两个"基本状态转移方程"当 i - 1 和 j - 1 分别越界的时候,做特殊判断,赋值为 0 即可
        for (int i = 0; i < len; i++) {
            for (int j = 0; j < k; j++) {
                if (i == 0) {
                    dp[i][j][1] = -prices[0];
                    dp[i][j][0] = 0;
                } else {
                    if (j == 0) {
                        dp[i][j][1] = Math.max(dp[i - 1][j][1], -prices[i]);
                    } else {
                        // 基本状态转移方程 1
                        dp[i][j][1] = Math.max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i]);
                    }
                    // 基本状态转移方程 2
                    dp[i][j][0] = Math.max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i]);
                }
            }
        }
        // 说明:i、j 状态都是前缀性质的,只需返回最后一个状态
        return dp[len - 1][k - 1][0];
    }

    private int greedy(int[] prices, int len) {
        // 转换为股票系列的第 2 题,使用贪心算法完成,思路是只要有利润,就交易
        int res = 0;
        for (int i = 1; i < len; i++) {
            if (prices[i - 1] < prices[i]) {
                res += prices[i] - prices[i - 1];
            }
        }
        return res;
    }
}

说明:状态数组 ij 的部分可以分别多设置一行,这样在代码中可以少掉一些判断,请读者实现一下,进行对比。

再写出状态压缩的版本。

Java 代码:

public class Solution {

    public int maxProfit(int k, int[] prices) {
        int len = prices.length;
        if (k == 0 || len < 2) {
            return 0;
        }
        if (k >= len / 2) {
            return greedy(prices, len);
        }

        int[][] dp = new int[k][2];

        for (int j = 0; j < k; j++) {
            dp[j][1] = -9999;
        }

        for (int price : prices) {
            for (int j = 0; j < k ; j++) {
                if (j == 0) {
                    dp[j][1] = Math.max(dp[j][1], -price);
                } else {
                    // 基本状态转移方程 1
                    dp[j][1] = Math.max(dp[j][1], dp[j - 1][0] - price);
                }
                // 基本状态转移方程 2
                dp[j][0] = Math.max(dp[j][0], dp[j][1] + price);
            }
        }
        return dp[k - 1][0];
    }

    private int greedy(int[] prices, int len) {
        int res = 0;
        for (int i = 1; i < len; i++) {
            if (prices[i - 1] < prices[i]) {
                res += prices[i] - prices[i - 1];
            }
        }
        return res;
    }
}

说明:状态转移方程可以设置 k + 1 行,第一行全为 0,感兴趣的读者可以尝试一下。

下面是状态数组语义化的版本,与上面的代码没有本质差别,供读者比对。

Java 代码:

import java.util.Arrays;

public class Solution12 {

    public int maxProfit(int k, int[] prices) {
        int len = prices.length;
        if (len < 2 || k == 0) {
            return 0;
        }
        if (k >= len / 2) {
            return greedy(prices, len);
        }

        // k 次持股分别的状态
        int[] stock = new int[k];
        Arrays.fill(stock, -9999);

        // k 次不持股(持有现金)分别的状态
        int[] cash = new int[k];

        for (int price : prices) {
            for (int i = 0; i < k; i++) {
                stock[i] = Math.max(stock[i], (i > 0 ? cash[i - 1] : 0) - price);
                cash[i] = Math.max(cash[i], stock[i] + price);
            }
        }
        return cash[k - 1];
    }

    private int greedy(int[] prices, int len) {
        int maxProfit = 0;
        for (int i = 1; i < len; i++) {
            if (prices[i] > prices[i - 1]) {
                maxProfit += prices[i] - prices[i - 1];
            }
        }
        return maxProfit;
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值