day49学习内容
day49主要内容
- 股票买卖的最佳时机
- 股票买卖的最佳时机II
声明
本文思路和文字,引用自《代码随想录》
一、股票买卖的最佳时机–仅一次买入和卖出
1.1、动态规划五部曲
1.1.1、 确定dp数组(dp table)以及下标的含义
-
在这段代码中,
dp[i]
代表的是一个长度为2的数组,它记录了第i
天结束时的两种不同状态下的最大利润。具体来说: -
dp[i][0]
:表示在第i
天结束时,如果你持有股票,那么到目前为止你能够获得的最大利润。这考虑了所有从第一天到第i
天的买入操作,选择了一个最优的买入时机使得利润最大化(即,买入价格最低的情况)。 -
dp[i][1]
:表示在第i
天结束时,如果你不持有股票,那么到目前为止你能够获得的最大利润。这涵盖了所有可能的卖出时机,从第一天到第i
天,选择了一个最优的卖出时机来最大化利润(即,卖出价格最高的情况,同时考虑到了买入的成本)。
1.1.2、确定递推公式
- 持有股票的最大利润状态,用
dp[i][0]
表示; - 不持有股票的最大利润状态,用
dp[i][1]
表示。
对于每一天i
,我们可以定义状态转移方程如下:
- 当天结束时持有股票(
dp[i][0]
)的状态可以通过以下方式之一得到:- 从前一天持有股票的状态转移过来,表示我们在第
i-1
天已经买入了股票,且第i
天没有卖出;或者 - 在第
i
天买入股票(如果之前没有买过),这意味着我们在考虑到目前为止的所有天中,选择在第i
天买入股票是最优的,因此此时的状态转移方程考虑的是直接买入第i
天的股票,利润为-prices[i]
。
- 从前一天持有股票的状态转移过来,表示我们在第
因此,持有股票状态的转移方程是:
dp[i][0]=max(dp[i−1][0],−prices[i])
- 当天结束时不持有股票(
dp[i][1]
)的状态可以通过以下方式之一得到:- 从前一天不持有股票的状态转移过来,表示我们在第
i-1
天卖出了股票,或者之前就没有买入过股票;或者 - 在第
i
天卖出股票,这意味着我们在第i
天结束前持有股票,且选择在第i
天卖出股票是最优的。此时的利润是第i
天的价格加上在第i-1
天持有股票时的利润。
- 从前一天不持有股票的状态转移过来,表示我们在第
因此,不持有股票状态的转移方程是:
dp[i][1]=max(dp[i−1][1],prices[i]+dp[i−1][0])
这两个方程一起描述了每一天可能达到的两种状态(持有股票和不持有股票)的最大利润,并指导了动态规划过程的每一步更新。最终,dp[length-1][1]
(其中length
是prices
数组的长度)给出了在规定的交易规则下(一次买入和一次卖出)可以获得的最大利润。
1.1.3、 dp数组如何初始化
// 第一天买入股票的花费(负利润)。
dp[0][0] = -prices[0];
// 第一天不持有股票的利润。
dp[0][1] = 0;
1.1.4、确定遍历顺序
从小到大遍历
1.2、代码
class Solution {
public int maxProfit(int[] prices) {
if (prices == null || prices.length == 0)
return 0;
int length = prices.length;
// dp[i][0]代表第i天持有股票的最大收益
// dp[i][1]代表第i天不持有股票的最大收益
int[][] dp = new int[length][2];
int result = 0;
// 第一天买入股票的花费(负利润)。
dp[0][0] = -prices[0];
// 第一天不持有股票的利润。
dp[0][1] = 0;
for (int i = 1; i < length; i++) {
// 在第i天持有股票的最大利润。这可以通过两种方式获得:要么保持前一天持有股票的状态(dp[i - 1][0]),
// 要么就是在第i天买入股票(-prices[i])。选择这两者之间的较大值
dp[i][0] = Math.max(dp[i - 1][0], -prices[i]);
// 在第i天不持有股票的最大利润。这也可以通过两种方式获得:要么保持前一天不持有股票的状态(dp[i - 1][1]),
// 要么是在第i天卖出股票,此时的利润为dp[i - 1][0] + prices[i]。选择这两者之间的较大值。
dp[i][1] = Math.max(dp[i - 1][0] + prices[i], dp[i - 1][1]);
}
// 最后一天结束时不持有股票所能获得的最大利润,因为一定要比最后一天持有股票的利润大。所以最后一天不持有就是所求的最大利润。
return dp[length - 1][1];
}
}
1.2.1、这里的1和0分别是什么意思
1
和0
用于索引dp
数组的第二维,具体代表着股票交易的两种不同状态:
-
0
代表在对应的天(第i
天)结束时,手上持有股票的状态。dp[i][0]
存储的是在第i
天结束时,如果手上持有股票,能够获得的最大利润。 -
1
代表在对应的天(第i
天)结束时,手上不持有股票的状态。dp[i][1]
存储的是在第i
天结束时,如果手上不持有股票,能够获得的最大利润。
在股票买卖的问题中,"持有股票"意味着你已经买入了股票并等待卖出的机会,这通常涉及到一个负的初始投资(因为你支付了钱来购买股票),所以在某些情况下,持有股票的最大利润可能是负数(如果你买入的价格比目前市场上任何价格都高的话)。而"不持有股票"意味着你要么卖出了股票,要么从未买入,这种状态下的利润是正的,因为它代表了实际的或潜在的盈利。
二、股票买卖的最佳时机II–多次买入和卖出
2.1、动态规划五部曲
2.1.1、 确定dp数组(dp table)以及下标的含义
- dp[i][0]:表示第 i 天结束时,如果你手上没有股票,你能获得的最大利润。这个状态可以是你在之前的某一天卖出了股票后一直未再买入,或者是你在第 i 天卖出了股票。
- dp[i][1]:表示第 i 天结束时,如果你手上持有一支股票,你能获得的最大利润。这个状态可以是你在之前就已经买入了股票且至今未卖出,或者是你在第 i 天买入了股票。
2.1.2、确定递推公式
状态定义
dp[i][0]
:表示第i
天结束时,手上没有股票时的最大利润。dp[i][1]
:表示第i
天结束时,手上持有一支股票时的最大利润。
状态转移方程
-
当天结束时手上没有股票的情况,有两个子情况:
- 从前一天就没有股票转移过来,即前一天的利润
dp[i-1][0]
; - 前一天持有股票,但在今天卖出,获得利润,即
dp[i-1][1] + prices[i]
。
因此,转移方程为:
dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i])
。 - 从前一天就没有股票转移过来,即前一天的利润
-
当天结束时手上持有一支股票的情况,也有两个子情况:
- 从前一天就持有这支股票转移过来,即前一天的利润
dp[i-1][1]
; - 前一天没有股票,但在今天买入,因此支付了价格,即
dp[i-1][0] - prices[i]
。
因此,转移方程为:
dp[i][1] = max(dp[i-1][1], dp[i-1][0] - prices[i])
。 - 从前一天就持有这支股票转移过来,即前一天的利润
2.1.3、 dp数组如何初始化
// 第一天开始时没有股票,利润为0
dp[0][0] = 0;
// 第一天买入股票,所以利润为负的股票价格。
dp[0][1] = -prices[0];
2.1.4、确定遍历顺序
从小到大遍历
2.2、代码
class Solution
public int maxProfit(int[] prices) {
int n = prices.length;
int[][] dp = new int[n][2];
// 第一天开始时没有股票,利润为0
dp[0][0] = 0;
// 第一天买入股票,所以利润为负的股票价格。
dp[0][1] = -prices[0];
for (int i = 1; i < n; ++i) {
// 如果今天手上没有股票,那么有两种可能,一是昨天也没有股票,利润不变;
// 二是昨天有股票,但今天卖掉了,所以要加上今天的股票价格。取这两种情况的较大值作为今天没有股票的最大利润。
dp[i][0] = Math.max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
// 如果今天手上有股票,那么有两种可能,一是昨天就持有股票,利润不变;
// 二是昨天没有股票,但今天买入了,所以要减去今天的股票价格。取这两种情况的较大值作为今天持有股票的最大利润。
dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
}
// 最后一天结束时手上没有股票的情况下的最大利润,也就是这段时间内可能获得的最大利润。
return dp[n - 1][0];
}
2.2.1、这里的0和1是什么意思。
- 0:表示手上没有股票。当我们看到
dp[i][0]
时,它代表的是在第i
天结束时,如果手上没有股票,能获得的最大利润。 - 1:表示手上持有一支股票。相应地,
dp[i][1]
表示的是在第i
天结束时,如果手上持有一支股票,能获得的最大利润。
动态规划数组 dp
通过这两种状态来追踪和更新每一天结束时可能的最大利润。对于每一天,我们都会计算和保存两个值:
- 如果这一天结束时我们没有股票,最大利润是多少;
- 如果这一天结束时我们持有股票,最大利润又是多少。这样,通过遍历所有的天数,并在每一天都基于前一天的情况计算这两个值,我们就可以找到最终的最大利润。
2.2.2、多次买入体现在哪里
多次买入的体现主要在于循环中对 dp[i][1]
的计算。
在代码中,dp[i][0]
表示在第 i
天结束时不持有股票的最大利润,而 dp[i][1]
表示在第 i
天结束时持有股票的最大利润。这两个状态之间的转换允许多次买卖:
-
dp[i][0] = Math.max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
这行表示,如果今天不持股,那么可能是昨天也不持股,或者昨天持股但今天卖出了。卖出操作体现了可以在任意时刻卖股票。 -
dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
这行表示,如果今天持股,那么可能是昨天就持股,或者昨天不持股但今天买入了。买入操作体现了可以在任意时刻买入股票。
因此,多次买入的情况在这个逻辑中是隐含的。每一天都决策是否买入或卖出,使得最终的利润最大化。由于循环覆盖了所有交易日,因此算法考虑了在任何可能的日子买入和卖出的情况,从而实现了多次交易以最大化利润。
2.3、为什么121和122题,0和1表示的意思是完全相反的?
121和122中的dp[i][0]
和dp[i][1]
确实表示的状态含义是相反的,这主要取决于它们各自如何定义这两个状态,以及如何从这些状态导出解决问题的逻辑。
在121中:
dp[i][0]
表示第i
天结束时持有股票的最大收益。dp[i][1]
代表第i
天结束时不持有股票的最大收益。
这里的逻辑考虑了你在每一天结束时的持股状态,但是对于买入股票的条件做了简化。买入股票的操作被简化为仅在第i
天买入的情况,而不考虑之前买入持有到第i
天的情况。
在122中:
dp[i][0]
表示在第i
天结束时不持有股票所能获得的最大利润。dp[i][1]
表示在第i
天结束时持有股票所能获得的最大利润。
逻辑是基于在每一天结束时你的持股状态,要么你持有股票,要么你不持有。如果你不持有股票,那么你今天可能没有进行任何操作(保持昨天的状态),或者你卖掉了股票(如果昨天持有股票)。如果你持有股票,那么你可能是继续持有(如果昨天就持有),或者是今天买入的(如果昨天不持有股票)。
总结
1.感想
- 好难的一天,感觉推导递归公式,不看题解的话,思路还是不够清晰
2.思维导图
本文思路引用自代码随想录,感谢代码随想录作者。