买卖股票的最佳时机 II
- 前言
买卖股票的最佳时机II,是一道非典型性的动态规划题目,正是由于其非典型性的特征,决定了动态规划数组构造非常麻烦,甚至觉得如果不参考具体答案,根本无法打开思路。拓展思维的关键是,对于给定一天的单股的股价,如果赋予负值,那么就表示买入;如果赋予正值,那么就表示卖出。能建立上述概概念是采用动态规划解决买卖股票的最佳时机II的关键和核心所在。
大多数的动态规划问题当中,其状态都是明确的,但是股票问题,我们需要构建每一天的0-1状态,如果当天的状态为0,就表示手头没有任何股票;如果当天的状态为1就表示手头上有股票,但是不清楚这个股票是在那一天买入的,由于买入也量化为负数的股价,所以dp数组中已经把买入的状态进行了记录,虽然不清楚是哪天买入的,但是其值已经记录在案,哪一天买入反倒不重要。
- 问题描述
给你一个整数数组
prices
,其中prices[i]
表示某支股票第i
天的价格。在每一天,你可以决定是否购买和/或出售股票。你在任何时候 最多 只能持有 一股 股票。你也可以先购买,然后在 同一天 出售。返回你能获得的 最大利润 。122. 买卖股票的最佳时机 II - 力扣(Leetcode)
示例 1:
输入:prices = [7,1,5,3,6,4]
输出:7
解释:在第 2 天(股票价格 = 1)的时候买入,在第 3 天(股票价格 = 5)的时候卖出,
这笔交易所能获得利润 = 5 - 1 = 4 。
随后,在第 4 天(股票价格 = 3)的时候买入,在第 5 天(股票价格 = 6)的时候卖出, 这笔交易所能获得利润 = 6 - 3 = 3 。
总利润为 4 + 3 = 7 。
示例 2:
输入:prices = [1,2,3,4,5]
输出:4
解释:在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4 。
总利润为 4 。
示例 3:
输入:prices = [7,6,4,3,1]
输出:0
解释:在这种情况下, 交易无法获得正利润,所以不参与交易可以获得最大利润,最大利润为 0 。
- 问题求解
a.) 贪心算法
最直观的求解方法就是,把给定的n个股价进行分割,分割的结果便为两个独立的股价数组,比如我们可以分割为(0,i)和 (i+1, n-1)两个数组,然后再对风格好的数组再进行两两分割,直到求解出各组的最大值的和为止。
代码类似贪心算法,
int max_profit_2(int *prices, int prices_size)
{
int ans = 0;
for (int i = 1; i < prices_size; ++i)
{
ans += findmax(0, prices[i] - prices[i - 1]);
}
return ans;
}
b.)动态规划
动态规划首先需要建立动态规划数组,动态规划数组采用dp[i][2]形式,定义状态dp[i][0]表示第i天交易完成后手里没有股票的最大利润,定义状态dp[i][1]表示第i天交易完成后手里持有一只股票的最大利润(i∈0~prices_size-1)。这个状态定义的相当出乎意料,正常情况下,dp[i][j]中定义j都是可变的变量,本题目却表示两种不同的股票拥有状态。
因为每天有两个状态,自然而然地推导出状态转移方程也有两个。根据前面的定义,我们每天都面临两种状态,手头持有一只股票和手头没有任何股票两类状态。面对这两个状态,都需要定义其状态转移方程。
第一个状态转移方程,需要和前一天的状态进行关联,假定前一天手头没有持有任何股票,那么就沿用前一天的状态值(dp[i-1][0]);如果前一天手头持有股票,那么就需要在当天抛掉股票,收益也即当天的股价prices[i],最终的值为(dp[i-1][1]+prices[i])。
d
p
[
i
]
[
0
]
=
f
m
a
x
{
d
p
[
i
−
1
]
[
0
]
,
d
p
[
i
−
1
[
1
]
+
p
r
i
c
e
s
[
i
]
}
;
dp[i][0]=fmax\{dp[i-1][0],dp[i-1[1]+prices[i]\};
dp[i][0]=fmax{dp[i−1][0],dp[i−1[1]+prices[i]};
同理第二个状态转移方程,相应地需要与前一天的状态进行关联,假定前一天手头持有股票,那么就保持状态不变化(dp[i-1][1]);如果前一天手头没有股票,那么就需要买入当天的股票(dp[i-1][0]-prices[i])
d
p
[
i
]
[
1
]
=
f
m
a
x
{
d
p
[
i
−
1
]
[
1
]
,
d
p
[
i
−
1
]
[
0
]
−
p
r
i
c
e
s
[
i
]
}
;
dp[i][1]=fmax\{dp[i-1][1],dp[i-1][0]-prices[i]\};
dp[i][1]=fmax{dp[i−1][1],dp[i−1][0]−prices[i]};
动态规划代码
int max_profit(int *prices, int prices_size)
{
// 0 indidcate there is no stock in the hand, 1 indicates we have one in hand
int dp[prices_size][2];
int i;
dp[0][0]=0;
// if you have stock for the first day,it means you have negative value
dp[0][1]=-prices[0];
for(i=1;i<prices_size;i++)
{
dp[i][0] = findmax(dp[i - 1][0], dp[i - 1][1] + prices[i]);
dp[i][1] = findmax(dp[i - 1][1], dp[i - 1][0] - prices[i]);
}
return dp[prices_size-1][0];
}
- 小结
面对每天的股票,都有两个初始状态,之前拥有股票[1],之前不拥有股票[0],对于这两类状态,分别和前一天的状态进行关联,从而求解出获得的最大利润。
参考资料: