洛谷P1025 [NOIP2001 提高组] 数的划分题解

在先前的文章中,我给大家讲了一些杂七杂八的东西,从今天开始,给大家带来一个主题:DP

众所周知,DP就是动态规划,详细戳这里

现在随便讲一下:

阶段:把所给求解问题的过程恰当地分成若干个相互联系的阶段,以便于求解,过程不同,阶段数就可能不同.描述阶段的变量称为阶段变量。在多数情况下,阶段变量是离散的,用k表示。此外,也有阶段变量是连续的情形。如果过程可以在任何时刻作出决策,且在任意两个不同的时刻之间允许有无穷多个决策时,阶段变量就是连续的。
状态:状态表示每个阶段开始面临的自然状况或客观条件,它不以人们的主观意志为转移,也称为不可控因素。在上面的例子中状态就是某阶段的出发位置,它既是该阶段某路的起点,同时又是前一阶段某支路的终点 。

无后效性:我们要求状态具有下面的性质:如果给定某一阶段的状态,则在这一阶段以后过程的发展不受这阶段以前各段状态的影响,所有各阶段都确定时,整个过程也就确定了。换句话说,过程的每一次实现可以用一个状态序列表示,在前面的例子中每阶段的状态是该线路的始点,确定了这些点的序列,整个线路也就完全确定。从某一阶段以后的线路开始,当这段的始点给定时,不受以前线路(所通过的点)的影响。状态的这个性质意味着过程的历史只能通过当前的状态去影响它的未来的发展,这个性质称为无后效性。

决策:一个阶段的状态给定以后,从该状态演变到下一阶段某个状态的一种选择(行动)称为决策。在最优控制中,也称为控制。在许多问题中,决策可以自然而然地表示为一个数或一组数。不同的决策对应着不同的数值。描述决策的变量称决策变量,因状态满足无后效性,故在每个阶段选择决策时只需考虑当前的状态而无须考虑过程的历史。
决策变量的范围称为允许决策集合。
策略:由每个阶段的决策组成的序列称为策略。对于每一个实际的多阶段决策过程,可供选取的策略有一定的范围限制,这个范围称为允许策略集合。

允许策略集合中达到最优效果的策略称为最优策略。

给定 k kk 阶段状态变量 x ( k ) x(k)x(k) 的值后,如果这一阶段的决策变量一经确定,第 k + 1 k+1k+1 阶段的状态变量 x ( k + 1 ) x(k+1)x(k+1) 也就完全确定,即 x ( k + 1 ) x(k+1)x(k+1) 的值随 x ( k ) x(k)x(k) 和第 k kk 阶段的决策 u ( k ) u(k)u(k) 的值变化而变化,那么可以把这一关系看成 ( x ( k ) , u ( k ) ) (x(k), u(k))(x(k),u(k)) 与 x ( k + 1 ) x(k+1)x(k+1) 确定的对应关系,用 x ( k + 1 ) = T k ( x ( k ) , u ( k ) ) x(k+1)=Tk(x(k),u(k))x(k+1)=Tk(x(k),u(k)) 表示。这是从 k kk 阶段到 k + 1 k+1k+1 阶段的状态转移规律,称为状态转移方程。

最优化原理:作为整个过程的最优策略,它满足:相对前面决策所形成的状态而言,余下的子策略必然构成“最优子策略”。
最优性原理实际上是要求问题的最优策略的子策略也是最优。
————————————————
版权声明:本文为CSDN博主「Code. 铠.」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_59197425/article/details/126499432

 也就是说DP必须有最优化原理和无后效性。

说了那么多,DP到底是啥可能还没法理解,简单来说,DP就是:取全体最优

和贪心不同,贪心是取局部最优

一般来说,DP的代码都比较短,但是难思考

那么,现在给大家带来一题:洛谷P1025 [NOIP2001 提高组] 数的划分

虽然这道题的算法标签是dfs/bfs,但是,这依旧是道DP的好题

思路有些难,尽量好好看:

DP的核心就是动态转移方程,在这道题中,很容易想到:

i<x 时 f[i][x]=0 , i=x 时 f[i][x]=1;

其余的状态分为两种情况:

1.有1的

2.没有1的

如果是第一种情况,那么方案数是:dp[i-1][x-1]

如果是第二种情况,那么方案数是:dp[i-1][x](i必须比x大)

所以,状态转移方程是:

dp[i][x]=dp[i-1][x-1]+dp[i-x][x];

最后,你们最喜欢的代码来了:

#include <cstdio>
int n,k,dp[250][10];
int main()
{
	scanf("%d%d",&n,&k);
	for (int i=1; i<=n; i++)
		dp[i][1]=1,dp[i][0]=1;
	for (int i=2; i<=k; i++)
		dp[1][i]=0,dp[0][i]=0;
	for (int i=2; i<=n; i++)
		for (int x=2; x<=k; x++)
			if (i>x) dp[i][x]=dp[i-1][x-1]+dp[i-x][x];
			else dp[i][x]=dp[i-1][x-1];
	printf("%d",dp[n][k]);
	return 0;
}

这篇文章我花了两年半,点赞关注收藏呗

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值