代码随想录算法训练营Day51 | 309. 最佳买卖股票时机含冷冻期 | 714. 买卖股票的最佳时机含手续费 | 股票总结

309. 最佳买卖股票时机含冷冻期

题目链接 | 解题思路

标准 dp

本题多了冷却期的条件,将原本的两个状态变得更复杂了。变化在于,如果考虑第 i 天的状态是“持有股票”,那么不能简单地推导为“第 i-1 天持有股票”和“第 i-1 天未持有股票,第 i 天买入股票”,因为可能第 i 天是冷却期。所以,需要特殊讨论针对冷却期的递推公式。

可以看到和之前的一个最大的区别在于,本题需要详细地分类讨论“不持有股票的状态”。每一天的情况可能是“持有股票”,“未持有股票 + 不在冷却期”,“未持有股票 + 在冷却期”,“未持有股票 + 刚卖出股票”。分类讨论的情况更多了,需要更清晰的递推公式。另外,本题还单独列出了“今天刚卖出股票”这个具体的动作状态,是因为“刚卖出股票” -> “冷却期”这个递推是确定的。

  1. dp 数组的下标含义:
    • dp[i][0]:第 i 天结束时持有股票
    • dp[i][1]:第 i 天结束时不持有股票 + 不在冷却期内
    • dp[i][2]:第 i 天结束时不持有股票 + 当天卖出股票
    • dp[i][3]:第 i 天结束时不持有股票 + 当天为冷却期
  2. dp 递推公式:
    • dp[i][0] = max(dp[i-1][0], dp[i-1][1] - prices[i], dp[i-1][3] - prices[i]),如果第 i 天持有股票,那么
      • i-1 天就持有股票,dp[i][0] = dp[i-1][0]
      • i-1 天不持有股票,那又分为两种情况
        • i-1 天是冷却期,第 i 天可以正常交易,dp[i][0] = dp[i-1][3]
        • i-1 天不在冷却期内,第 i 天可以正常交易,dp[i][0] = dp[i-1][1]
    • dp[i][1] = max(dp[i-1][1], dp[i-1][3]),如果第 i 天不是冷却期,那么
      • i-1 天就不在冷却期,dp[i][1] = dp[i-1][1]
      • i-1 天就是冷却期,dp[i][1] = dp[i-1][3]
    • dp[i][2] = dp[i-1][0] + prices[i],如果第 i 天要卖出股票,那么第 i-1 天必然是持有股票的
    • dp[i][3] = dp[i-1][2],如果第 i 天是冷却期,那么第 i-1 天必然是卖出股票的
  3. dp 数组的初始化:初始化自然是考虑第一天,本题的初始化还是有些难判断的
    • dp[0][0] = -prices[0]:显然,第一天结束时持有股票,那只能是第一天购买了股票
    • dp[0][1] = 0:显然,第一天结束时没有持有股票,只能是第一天没有任何操作
    • dp[0][2] = 0:符合定义的话,只能是第一天就买入再卖出股票,收益为 0
    • dp[0][3] = 0:根据定义,这个状态是非法的,因为很明显不可能在第一天就进入冷却期(没有办法在前一天卖出股票)。然而定义上非法的初始化,也要为了后续的递推服务,所以可以根据递推公式来得到初始化的值:
      • 在第二天的状态中,只有 dp[1][1] = max(dp[0][1], dp[0][3]) 会用到 dp[0][3]。从含义上,第二天如果不持有股票并且不在冷却期,那么第一天就肯定没有买入股票,dp[1][1] 应该是 0(dp[0][1])。那么为了得到正确的 dp[1][1],我们应该初始化 dp[0][3] = 0
  4. dp 的遍历顺序:从前向后即可。
  5. 举例推导:
12302
0-1-1-111
100012
2012-13
30012-1
class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        if len(prices) == 1:
            return 0

        dp = [[0] * 4 for _ in range(len(prices))]
        dp[0][0] = -prices[0]

        for i in range(1, len(prices)):
            dp[i][0] = max(dp[i-1][0], dp[i-1][1] - prices[i], dp[i-1][3] - prices[i])
            dp[i][1] = max(dp[i-1][1], dp[i-1][3])
            dp[i][2] = dp[i-1][0] + prices[i]
            dp[i][3] = dp[i-1][2]
                
        return max(dp[-1][1], dp[-1][2], dp[-1][3])

和之前一样,也可以优化成 O ( 1 ) O(1) O(1) 的空间复杂度。

机智的分析解法

本题和122. 买卖股票的最佳时机II的区别只在于多了一个冷却期。如上的状态分析是解决题目的标准流程。但是延续之前题目的做法,同样也能解决这道题。注意到,不持有股票的状态不会受到任何影响,只有想要买入股票的时候需要考虑冷却期的存在。

关键在于:“如果第 i 天持有股票,那么当前的收益究竟怎么进行推导”

  • 如果第 i - 1 天就持有股票,那么就直接复制前一天的状态,dp[i][1] = dp[i-1][1]
  • 如果第 i - 1 天未持有股票,那么分两种情况:
    • i - 1 天是冷却期,那么就是在第 i - 2 天卖出了股票,dp[i][1] = dp[i-2][0] - prices[i]
    • i - 1 天不是冷却期,那么应该得到 dp[i][1] = dp[i-1][0] - prices[i]

如果根据以上的状态分析,无法得到一个 closed-form 的递推公式,因为我们不知道第 i-1 天是否是冷却期,也就不知道何时该使用 dp[i][1] = max(dp[i-1][1], dp[i-1][0] - prices[i]),何时该使用 dp[i][1] = max(dp[i-1][1], dp[i-2][0] - prices[i])
但是,如果第 i-1 天不是冷却期且不持有股票,那么第 i-1 天只有两种情况:

  • 之前从来没有交易过股票
  • i - 2 天或之前是冷却期

无论是哪种情况,我们都能得到 dp[i-1][0] = dp[i-2][0]。所以虽然第 i-1 天的状态是否是冷却期不得而知,但是第 i 天持有股票的递推公式可以确定是 dp[i][1] = max(dp[i-1][1], dp[i-2][0] - prices[i])

这样,我们只需要最小限度地修改122. 买卖股票的最佳时机II的代码,就能解题。

class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        if len(prices) == 1:
            return 0

        # dp[i][0] represents the max profit on day i without the stock
        # dp[i][1] represents the max profit on day i with the stock
        dp = [[0, 0] for _ in range(len(prices))]
        dp[0] = [0, -prices[0]]
        dp[1] = [max(0, prices[1] - prices[0]), max(-prices[0], -prices[1])]

        for i in range(2, len(prices)):
            dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i])
            dp[i][1] = max(dp[i-1][1], dp[i-2][0] - prices[i])
        
        return dp[-1][0]

714. 买卖股票的最佳时机含手续费

题目链接 | 解题思路

本题的 dp 解法和122. 买卖股票的最佳时机II唯一的区别是多了一个手续费,所以从“持有股票”到“未持有股票”的利润递推需要多减去手续费,其他全部保持不变。

class Solution:
    def maxProfit(self, prices: List[int], fee: int) -> int:
        # dp[i][0] represents the max profit on day i without the stock
        # dp[i][1] represents the max profit on day i with the stock
        dp = [[0, 0] for _ in range(len(prices))]
        dp[0] = [0, -prices[0]]

        for i in range(1, len(prices)):
            dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i] - fee)
            dp[i][1] = max(dp[i-1][1], dp[i-1][0] - prices[i])
        
        return dp[-1][0]

贪心算法

贪心解法
本题也可以用贪心算法来解决,也算是照应了122. 买卖股票的最佳时机II。但是本题的贪心解法不像之前一样简单,在计算的时候对所需要的区间要求更高,情况也更复杂。

如果简单计算所有增区间,那么就会遇到有的区间利润不足以抵手续费的情况,同时多次买卖也会导致更多的手续费,从而使利润降低。所以我们想找到的区间,应该是:

  • 买入利润:遇到更低的价格就更新记录;
  • 卖出利润:按理来说是当前增最大区间的最后一天的利润。但是没必要具体知道哪一天进行了卖出,只要当能够盈利的时候进行一次模拟的卖出即可,同样能够得到正确的利润(但是需要一些小技巧)。

如下,在第一次发现当前的交易能够制造利润时(prices[i] > min_price + fee),我们会选择直接进行当前交易,并且扣除一次手续费,随后减少 min_price。之后会有两种情况:假设 fee = 2,

  • prices = [1, 4, 0, 5]
    • 第二天,发现有真正的盈利,profit = 1, min_price = 2
    • 第三天,发现了更低的价格,min_price = 0,将会开始新的交易,同时结束了上一次的交易(记录区间)
  • prices = [1, 5, 8]
    • 第二天,发现有真正的盈利,profit = 2, min_price = 3
    • 第三天,发现有真正的盈利,此时新的盈利为5,而不是预计的3,因为 min_price 在这次计算前发生了变化,相当于抵消了该次交易的手续费

所以模拟的卖出实际上是在第一次发现真正的盈利后,就记录一次交易的手续费,并且改变当前的 min_price,从而免除当前区间的后续交易(如果存在)的手续费。着实非常巧妙!

class Solution:
    def maxProfit(self, prices: List[int], fee: int) -> int:
        min_price = prices[0]
        profit = 0

        for i in range(1, len(prices)):
            if prices[i] < min_price:
                min_price = prices[i]
            
            if prices[i] <= prices[i] <= min_price + fee:
                continue
            
            if prices[i] > min_price + fee:
                profit += (prices[i] - min_price) - fee
                min_price = prices[i] - fee
        
        return profit

股票总结

股票问题总结

股票问题是第一次在 dp 中需要记录状态的题型。之前的 dp 题,无论是打家劫舍还是背包问题,都是考验对子问题最优解的利用,即正确的递推公式+遍历顺序。股票问题则需要对子问题进行分类讨论,记录各个状态下的子问题最优解,这一点是非常新颖的。同时,不知道是不是巧合,大部分股票问题都可以用贪心来解决,虽然实现贪心的难度不小。

最标准的股票问题应该是122. 买卖股票的最佳时机II,需要真正地记录并利用状态。

随后,复杂的限制交易次数的股票问题188.买卖股票的最佳时机IV把 dp 变得更复杂了,相比于之前的标准题,有了类似爬楼梯式的进阶。

而堪称神题的是309.最佳买卖股票时机含冷冻期。标准解法中,活用了状态分类的思想,将原本的“未持有股票”进一步细分,来适应新条件下的递推公式。而机智的分析算法中,通过分析最小限度地修改了之前的代码,解决了问题。两种解法都非常重要,代表了股票问题的精华。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值