代码随想录刷题day49|股票买卖的最佳时机(仅一次买入和卖出)&股票买卖的最佳时机II(多次买入和卖出)

文章详细解析了股票买卖问题中,利用动态规划解决一次买入和卖出、以及多次买入和卖出的策略。通过dp数组的构建、递推公式确定、初始化和遍历顺序,展示了如何计算在给定时间点的最大利润。
摘要由CSDN通过智能技术生成


day49学习内容

day49主要内容

  • 股票买卖的最佳时机
  • 股票买卖的最佳时机II

声明
本文思路和文字,引用自《代码随想录》


一、股票买卖的最佳时机–仅一次买入和卖出

121.原题链接

1.1、动态规划五部曲

1.1.1、 确定dp数组(dp table)以及下标的含义

  • 在这段代码中,dp[i]代表的是一个长度为2的数组,它记录了第i天结束时的两种不同状态下的最大利润。具体来说:

  • dp[i][0]:表示在第i天结束时,如果你持有股票,那么到目前为止你能够获得的最大利润。这考虑了所有从第一天到第i天的买入操作,选择了一个最优的买入时机使得利润最大化(即,买入价格最低的情况)。

  • dp[i][1]:表示在第i天结束时,如果你不持有股票,那么到目前为止你能够获得的最大利润。这涵盖了所有可能的卖出时机,从第一天到第i天,选择了一个最优的卖出时机来最大化利润(即,卖出价格最高的情况,同时考虑到了买入的成本)。

1.1.2、确定递推公式

  1. 持有股票的最大利润状态,用dp[i][0]表示;
  2. 不持有股票的最大利润状态,用dp[i][1]表示。

对于每一天i,我们可以定义状态转移方程如下:

  • 当天结束时持有股票(dp[i][0])的状态可以通过以下方式之一得到:
    • 从前一天持有股票的状态转移过来,表示我们在第i-1天已经买入了股票,且第i天没有卖出;或者
    • 在第i天买入股票(如果之前没有买过),这意味着我们在考虑到目前为止的所有天中,选择在第i天买入股票是最优的,因此此时的状态转移方程考虑的是直接买入第i天的股票,利润为-prices[i]

因此,持有股票状态的转移方程是:

dp[i][0]=max(dp[i−1][0],−prices[i])
  • 当天结束时不持有股票(dp[i][1])的状态可以通过以下方式之一得到:
    • 从前一天不持有股票的状态转移过来,表示我们在第i-1天卖出了股票,或者之前就没有买入过股票;或者
    • 在第i天卖出股票,这意味着我们在第i天结束前持有股票,且选择在第i天卖出股票是最优的。此时的利润是第i天的价格加上在第i-1天持有股票时的利润。

因此,不持有股票状态的转移方程是:

dp[i][1]=max(dp[i−1][1],prices[i]+dp[i−1][0])

这两个方程一起描述了每一天可能达到的两种状态(持有股票和不持有股票)的最大利润,并指导了动态规划过程的每一步更新。最终,dp[length-1][1](其中lengthprices数组的长度)给出了在规定的交易规则下(一次买入和一次卖出)可以获得的最大利润。

1.1.3、 dp数组如何初始化

// 第一天买入股票的花费(负利润)。
dp[0][0] = -prices[0];
// 第一天不持有股票的利润。
dp[0][1] = 0;

1.1.4、确定遍历顺序

从小到大遍历

1.2、代码

class Solution {
    public int maxProfit(int[] prices) {
        if (prices == null || prices.length == 0)
            return 0;
        int length = prices.length;
        // dp[i][0]代表第i天持有股票的最大收益
        // dp[i][1]代表第i天不持有股票的最大收益
        int[][] dp = new int[length][2];
        int result = 0;
        // 第一天买入股票的花费(负利润)。
        dp[0][0] = -prices[0];
        // 第一天不持有股票的利润。
        dp[0][1] = 0;
        for (int i = 1; i < length; i++) {
            // 在第i天持有股票的最大利润。这可以通过两种方式获得:要么保持前一天持有股票的状态(dp[i - 1][0]),
            // 要么就是在第i天买入股票(-prices[i])。选择这两者之间的较大值
            dp[i][0] = Math.max(dp[i - 1][0], -prices[i]);
            // 在第i天不持有股票的最大利润。这也可以通过两种方式获得:要么保持前一天不持有股票的状态(dp[i - 1][1]),
            // 要么是在第i天卖出股票,此时的利润为dp[i - 1][0] + prices[i]。选择这两者之间的较大值。
            dp[i][1] = Math.max(dp[i - 1][0] + prices[i], dp[i - 1][1]);
        }
        // 最后一天结束时不持有股票所能获得的最大利润,因为一定要比最后一天持有股票的利润大。所以最后一天不持有就是所求的最大利润。
        return dp[length - 1][1];
    }
}

1.2.1、这里的1和0分别是什么意思

10用于索引dp数组的第二维,具体代表着股票交易的两种不同状态:

  • 0代表在对应的天(第i天)结束时,手上持有股票的状态。dp[i][0]存储的是在第i天结束时,如果手上持有股票,能够获得的最大利润。

  • 1代表在对应的天(第i天)结束时,手上不持有股票的状态。dp[i][1]存储的是在第i天结束时,如果手上不持有股票,能够获得的最大利润。

在股票买卖的问题中,"持有股票"意味着你已经买入了股票并等待卖出的机会,这通常涉及到一个负的初始投资(因为你支付了钱来购买股票),所以在某些情况下,持有股票的最大利润可能是负数(如果你买入的价格比目前市场上任何价格都高的话)。而"不持有股票"意味着你要么卖出了股票,要么从未买入,这种状态下的利润是正的,因为它代表了实际的或潜在的盈利。

二、股票买卖的最佳时机II–多次买入和卖出

122.原题链接

2.1、动态规划五部曲

2.1.1、 确定dp数组(dp table)以及下标的含义

  • dp[i][0]:表示第 i 天结束时,如果你手上没有股票,你能获得的最大利润。这个状态可以是你在之前的某一天卖出了股票后一直未再买入,或者是你在第 i 天卖出了股票。
  • dp[i][1]:表示第 i 天结束时,如果你手上持有一支股票,你能获得的最大利润。这个状态可以是你在之前就已经买入了股票且至今未卖出,或者是你在第 i 天买入了股票。

2.1.2、确定递推公式

状态定义

  • dp[i][0]:表示第 i 天结束时,手上没有股票时的最大利润。
  • dp[i][1]:表示第 i 天结束时,手上持有一支股票时的最大利润。

状态转移方程

  1. 当天结束时手上没有股票的情况,有两个子情况:

    • 从前一天就没有股票转移过来,即前一天的利润 dp[i-1][0]
    • 前一天持有股票,但在今天卖出,获得利润,即 dp[i-1][1] + prices[i]

    因此,转移方程为:dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i])

  2. 当天结束时手上持有一支股票的情况,也有两个子情况:

    • 从前一天就持有这支股票转移过来,即前一天的利润 dp[i-1][1]
    • 前一天没有股票,但在今天买入,因此支付了价格,即 dp[i-1][0] - prices[i]

    因此,转移方程为:dp[i][1] = max(dp[i-1][1], dp[i-1][0] - prices[i])

2.1.3、 dp数组如何初始化

// 第一天开始时没有股票,利润为0
dp[0][0] = 0;    
// 第一天买入股票,所以利润为负的股票价格。               
dp[0][1] = -prices[0];

2.1.4、确定遍历顺序

从小到大遍历

2.2、代码

class Solution 
    public int maxProfit(int[] prices) {
        int n = prices.length;
        int[][] dp = new int[n][2];     
        // 第一天开始时没有股票,利润为0
        dp[0][0] = 0;    
        // 第一天买入股票,所以利润为负的股票价格。               
        dp[0][1] = -prices[0];
        for (int i = 1; i < n; ++i) {
            // 如果今天手上没有股票,那么有两种可能,一是昨天也没有股票,利润不变;
            // 二是昨天有股票,但今天卖掉了,所以要加上今天的股票价格。取这两种情况的较大值作为今天没有股票的最大利润。
            dp[i][0] = Math.max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
            // 如果今天手上有股票,那么有两种可能,一是昨天就持有股票,利润不变;
            // 二是昨天没有股票,但今天买入了,所以要减去今天的股票价格。取这两种情况的较大值作为今天持有股票的最大利润。    
            dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);   
        }
        // 最后一天结束时手上没有股票的情况下的最大利润,也就是这段时间内可能获得的最大利润。
        return dp[n - 1][0];   
}

2.2.1、这里的0和1是什么意思。

  • 0:表示手上没有股票。当我们看到 dp[i][0] 时,它代表的是在第 i 天结束时,如果手上没有股票,能获得的最大利润。
  • 1:表示手上持有一支股票。相应地,dp[i][1] 表示的是在第 i 天结束时,如果手上持有一支股票,能获得的最大利润。

动态规划数组 dp 通过这两种状态来追踪和更新每一天结束时可能的最大利润。对于每一天,我们都会计算和保存两个值:

  • 如果这一天结束时我们没有股票,最大利润是多少;
  • 如果这一天结束时我们持有股票,最大利润又是多少。这样,通过遍历所有的天数,并在每一天都基于前一天的情况计算这两个值,我们就可以找到最终的最大利润。

2.2.2、多次买入体现在哪里

多次买入的体现主要在于循环中对 dp[i][1] 的计算。

在代码中,dp[i][0] 表示在第 i 天结束时不持有股票的最大利润,而 dp[i][1] 表示在第 i 天结束时持有股票的最大利润。这两个状态之间的转换允许多次买卖:

  • dp[i][0] = Math.max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
    这行表示,如果今天不持股,那么可能是昨天也不持股,或者昨天持股但今天卖出了。卖出操作体现了可以在任意时刻卖股票。

  • dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
    这行表示,如果今天持股,那么可能是昨天就持股,或者昨天不持股但今天买入了。买入操作体现了可以在任意时刻买入股票。

因此,多次买入的情况在这个逻辑中是隐含的。每一天都决策是否买入或卖出,使得最终的利润最大化。由于循环覆盖了所有交易日,因此算法考虑了在任何可能的日子买入和卖出的情况,从而实现了多次交易以最大化利润。

2.3、为什么121和122题,0和1表示的意思是完全相反的?

121和122中的dp[i][0]dp[i][1]确实表示的状态含义是相反的,这主要取决于它们各自如何定义这两个状态,以及如何从这些状态导出解决问题的逻辑。

121中:

  • dp[i][0]表示第i天结束时持有股票的最大收益。
  • dp[i][1]代表第i天结束时不持有股票的最大收益。

这里的逻辑考虑了你在每一天结束时的持股状态,但是对于买入股票的条件做了简化。买入股票的操作被简化为仅在第i天买入的情况,而不考虑之前买入持有到第i天的情况。

122中:

  • dp[i][0]表示在第i天结束时不持有股票所能获得的最大利润。
  • dp[i][1]表示在第i天结束时持有股票所能获得的最大利润。

逻辑是基于在每一天结束时你的持股状态,要么你持有股票,要么你不持有。如果你不持有股票,那么你今天可能没有进行任何操作(保持昨天的状态),或者你卖掉了股票(如果昨天持有股票)。如果你持有股票,那么你可能是继续持有(如果昨天就持有),或者是今天买入的(如果昨天不持有股票)。

总结

1.感想

  • 好难的一天,感觉推导递归公式,不看题解的话,思路还是不够清晰

2.思维导图

本文思路引用自代码随想录,感谢代码随想录作者。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值