代码随想录刷题day49｜股票买卖的最佳时机(仅一次买入和卖出)&股票买卖的最佳时机II(多次买入和卖出)-CSDN博客

本文链接：https://blog.csdn.net/Yang_Yang_66666/article/details/137563832

文章详细解析了股票买卖问题中，利用动态规划解决一次买入和卖出、以及多次买入和卖出的策略。通过dp数组的构建、递推公式确定、初始化和遍历顺序，展示了如何计算在给定时间点的最大利润。

摘要由CSDN通过智能技术生成

day49学习内容

day49主要内容

股票买卖的最佳时机
股票买卖的最佳时机II

声明
本文思路和文字，引用自《代码随想录》

一、股票买卖的最佳时机–仅一次买入和卖出

121.原题链接

1.1、动态规划五部曲

1.1.1、确定dp数组（dp table）以及下标的含义

在这段代码中，dp[i]代表的是一个长度为2的数组，它记录了第i天结束时的两种不同状态下的最大利润。具体来说：
dp[i][0]：表示在第i天结束时，如果你持有股票，那么到目前为止你能够获得的最大利润。这考虑了所有从第一天到第i天的买入操作，选择了一个最优的买入时机使得利润最大化（即，买入价格最低的情况）。
dp[i][1]：表示在第i天结束时，如果你不持有股票，那么到目前为止你能够获得的最大利润。这涵盖了所有可能的卖出时机，从第一天到第i天，选择了一个最优的卖出时机来最大化利润（即，卖出价格最高的情况，同时考虑到了买入的成本）。

1.1.2、确定递推公式

持有股票的最大利润状态，用dp[i][0]表示；
不持有股票的最大利润状态，用dp[i][1]表示。

对于每一天i，我们可以定义状态转移方程如下：

当天结束时持有股票（dp[i][0]）的状态可以通过以下方式之一得到：
- 从前一天持有股票的状态转移过来，表示我们在第i-1天已经买入了股票，且第i天没有卖出；或者
- 在第i天买入股票（如果之前没有买过），这意味着我们在考虑到目前为止的所有天中，选择在第i天买入股票是最优的，因此此时的状态转移方程考虑的是直接买入第i天的股票，利润为-prices[i]。

因此，持有股票状态的转移方程是：

dp[i][0]=max(dp[i−1][0],−prices[i])

当天结束时不持有股票（dp[i][1]）的状态可以通过以下方式之一得到：
- 从前一天不持有股票的状态转移过来，表示我们在第i-1天卖出了股票，或者之前就没有买入过股票；或者
- 在第i天卖出股票，这意味着我们在第i天结束前持有股票，且选择在第i天卖出股票是最优的。此时的利润是第i天的价格加上在第i-1天持有股票时的利润。

因此，不持有股票状态的转移方程是：

dp[i][1]=max(dp[i−1][1],prices[i]+dp[i−1][0])

这两个方程一起描述了每一天可能达到的两种状态（持有股票和不持有股票）的最大利润，并指导了动态规划过程的每一步更新。最终，dp[length-1][1]（其中length是prices数组的长度）给出了在规定的交易规则下（一次买入和一次卖出）可以获得的最大利润。

1.1.3、 dp数组如何初始化

// 第一天买入股票的花费（负利润）。
dp[0][0] = -prices[0];
// 第一天不持有股票的利润。
dp[0][1] = 0;

1.1.4、确定遍历顺序

从小到大遍历

1.2、代码

class Solution {
    public int maxProfit(int[] prices) {
        if (prices == null || prices.length == 0)
            return 0;
        int length = prices.length;
        // dp[i][0]代表第i天持有股票的最大收益
        // dp[i][1]代表第i天不持有股票的最大收益
        int[][] dp = new int[length][2];
        int result = 0;
        // 第一天买入股票的花费（负利润）。
        dp[0][0] = -prices[0];
        // 第一天不持有股票的利润。
        dp[0][1] = 0;
        for (int i = 1; i < length; i++) {
            // 在第i天持有股票的最大利润。这可以通过两种方式获得：要么保持前一天持有股票的状态（dp[i - 1][0]），
            // 要么就是在第i天买入股票（-prices[i]）。选择这两者之间的较大值
            dp[i][0] = Math.max(dp[i - 1][0], -prices[i]);
            // 在第i天不持有股票的最大利润。这也可以通过两种方式获得：要么保持前一天不持有股票的状态（dp[i - 1][1]），
            // 要么是在第i天卖出股票，此时的利润为dp[i - 1][0] + prices[i]。选择这两者之间的较大值。
            dp[i][1] = Math.max(dp[i - 1][0] + prices[i], dp[i - 1][1]);
        }
        // 最后一天结束时不持有股票所能获得的最大利润，因为一定要比最后一天持有股票的利润大。所以最后一天不持有就是所求的最大利润。
        return dp[length - 1][1];
    }
}

1.2.1、这里的1和0分别是什么意思

1和0用于索引dp数组的第二维，具体代表着股票交易的两种不同状态：

0代表在对应的天（第i天）结束时，手上持有股票的状态。dp[i][0]存储的是在第i天结束时，如果手上持有股票，能够获得的最大利润。
1代表在对应的天（第i天）结束时，手上不持有股票的状态。dp[i][1]存储的是在第i天结束时，如果手上不持有股票，能够获得的最大利润。

在股票买卖的问题中，"持有股票"意味着你已经买入了股票并等待卖出的机会，这通常涉及到一个负的初始投资（因为你支付了钱来购买股票），所以在某些情况下，持有股票的最大利润可能是负数（如果你买入的价格比目前市场上任何价格都高的话）。而"不持有股票"意味着你要么卖出了股票，要么从未买入，这种状态下的利润是正的，因为它代表了实际的或潜在的盈利。

二、股票买卖的最佳时机II–多次买入和卖出

122.原题链接

2.1、动态规划五部曲

2.1.1、确定dp数组（dp table）以及下标的含义

dp[i][0]：表示第 i 天结束时，如果你手上没有股票，你能获得的最大利润。这个状态可以是你在之前的某一天卖出了股票后一直未再买入，或者是你在第 i 天卖出了股票。
dp[i][1]：表示第 i 天结束时，如果你手上持有一支股票，你能获得的最大利润。这个状态可以是你在之前就已经买入了股票且至今未卖出，或者是你在第 i 天买入了股票。

2.1.2、确定递推公式

状态定义

dp[i][0]：表示第 i 天结束时，手上没有股票时的最大利润。
dp[i][1]：表示第 i 天结束时，手上持有一支股票时的最大利润。

状态转移方程

当天结束时手上没有股票的情况，有两个子情况：
- 从前一天就没有股票转移过来，即前一天的利润 dp[i-1][0]；
- 前一天持有股票，但在今天卖出，获得利润，即 dp[i-1][1] + prices[i]。
因此，转移方程为：dp[i][0] = max(dp[i-1][0], dp[i-1][1] + prices[i])。
当天结束时手上持有一支股票的情况，也有两个子情况：
- 从前一天就持有这支股票转移过来，即前一天的利润 dp[i-1][1]；
- 前一天没有股票，但在今天买入，因此支付了价格，即 dp[i-1][0] - prices[i]。
因此，转移方程为：dp[i][1] = max(dp[i-1][1], dp[i-1][0] - prices[i])。

2.1.3、 dp数组如何初始化

// 第一天开始时没有股票，利润为0
dp[0][0] = 0;    
// 第一天买入股票，所以利润为负的股票价格。               
dp[0][1] = -prices[0];

2.1.4、确定遍历顺序

从小到大遍历

2.2、代码

class Solution 
    public int maxProfit(int[] prices) {
        int n = prices.length;
        int[][] dp = new int[n][2];     
        // 第一天开始时没有股票，利润为0
        dp[0][0] = 0;    
        // 第一天买入股票，所以利润为负的股票价格。               
        dp[0][1] = -prices[0];
        for (int i = 1; i < n; ++i) {
            // 如果今天手上没有股票，那么有两种可能，一是昨天也没有股票，利润不变；
            // 二是昨天有股票，但今天卖掉了，所以要加上今天的股票价格。取这两种情况的较大值作为今天没有股票的最大利润。
            dp[i][0] = Math.max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
            // 如果今天手上有股票，那么有两种可能，一是昨天就持有股票，利润不变；
            // 二是昨天没有股票，但今天买入了，所以要减去今天的股票价格。取这两种情况的较大值作为今天持有股票的最大利润。    
            dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);   
        }
        // 最后一天结束时手上没有股票的情况下的最大利润，也就是这段时间内可能获得的最大利润。
        return dp[n - 1][0];   
}

2.2.1、这里的0和1是什么意思。

0：表示手上没有股票。当我们看到 dp[i][0] 时，它代表的是在第 i 天结束时，如果手上没有股票，能获得的最大利润。
1：表示手上持有一支股票。相应地，dp[i][1] 表示的是在第 i 天结束时，如果手上持有一支股票，能获得的最大利润。

动态规划数组 dp 通过这两种状态来追踪和更新每一天结束时可能的最大利润。对于每一天，我们都会计算和保存两个值：

如果这一天结束时我们没有股票，最大利润是多少；
如果这一天结束时我们持有股票，最大利润又是多少。这样，通过遍历所有的天数，并在每一天都基于前一天的情况计算这两个值，我们就可以找到最终的最大利润。

2.2.2、多次买入体现在哪里

多次买入的体现主要在于循环中对 dp[i][1] 的计算。

在代码中，dp[i][0] 表示在第 i 天结束时不持有股票的最大利润，而 dp[i][1] 表示在第 i 天结束时持有股票的最大利润。这两个状态之间的转换允许多次买卖：

dp[i][0] = Math.max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
这行表示，如果今天不持股，那么可能是昨天也不持股，或者昨天持股但今天卖出了。卖出操作体现了可以在任意时刻卖股票。
dp[i][1] = Math.max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
这行表示，如果今天持股，那么可能是昨天就持股，或者昨天不持股但今天买入了。买入操作体现了可以在任意时刻买入股票。

因此，多次买入的情况在这个逻辑中是隐含的。每一天都决策是否买入或卖出，使得最终的利润最大化。由于循环覆盖了所有交易日，因此算法考虑了在任何可能的日子买入和卖出的情况，从而实现了多次交易以最大化利润。