状态压缩dp(状压dp)

最新推荐文章于 2025-04-08 20:54:08 发布

糖宋元明清

最新推荐文章于 2025-04-08 20:54:08 发布

阅读量3.3w

点赞数 92

分类专栏：动态规划动态规划文章标签：状压dp 状态压缩动态规划

本文链接：https://blog.csdn.net/u013377068/article/details/81054112

版权

动态规划同时被 2 个专栏收录

5 篇文章

订阅专栏

动态规划

3 篇文章

订阅专栏

注：在涉及到位运算时，一定要注意位运算的优先级。该加的括号一定要加

状压dp是一类比较难理解的dp;

在讲状压dp之前，我们应该清楚所有的dp是解决多阶段决策最优化问题的一种思想方法；

请注意多阶段这三个字：

经过前面三种背包的学习，可以发现如何定义状态是解决动态规划最重要的一步；

状态的定义也就决定了相当于阶段的划分；

在背包问题中，我们通过物品的件数i和背包的容量j来定义状态或者说是划分阶段；

动态规划多阶段一个重要的特性就是无后效性。无后效性就是值对于某个给定的阶段状态，它以前各阶段的状态无法

直接影响它未来的发展，而只能通过当前的这个状态。换句话说影响当前阶段状态只可能是前一阶段的状态；

那么可以看出如何定义状态是至关重要的，因为状态决定了阶段的划分，阶段的划分保证了无后效性。

————————————————————————————————————————————————————

以上讲了一些基本的概念，以下具体用一个例子和一些习题讲一下状压dp；

有时候为了达到最优子结构和无后效性的效果，我们必须要定义好状态。但是有时候状态维度特别多，但是每个状态的

决策又很少，这样我们开多维数组很可能会浪费，并且可能会爆空间。

这时候我们考虑用状态压缩来做，比如每个状态的决策只有两个，但是状态的维度很多。下面我们用01背包来举例。

有n件物品和一个容量为v的背包。放入第i件物品的占的空间为Ci,得到的价值是Wi;求解每种放法的背包价值；

（当然这不是一个典型的动态规划问题，但是用动态规划的思想有助于讲解状压dp）;

想一想之前动态规划框架讲解，解决动态规划问题首先要定义状态；

1.定义状态：因为这个要求每一种放法的背包价值，所以我们状态应该是这n件物品的放与不放的情况。

最容易想到的是开个n维数组，第i个维度的下标如果是1的话代表放第i件物品，0的话代表不放第i件物品；

但是这样很容易造成空间浪费，而且多维数组也不好开；

我们仔细观察就会发现，每件物品有放与不放两种选择；假设我们有5件物品的时候，用1和0代表放和不放

如果这5件物品都不放的话，那就是00000;

如果这5件物品都放的话，那就是11111；

看到这，我们知道可以用二进制表示所有物品的放与不放的情况；如果这些二进制用十进制表示的话就只有

一个维度了。而且这一个维度能表示所有物品放与不放的情况；这个过程就叫做状态压缩；

细节：观察可以知道在上面的例子中00000 ~ 11111可以代表所有的情况，转化为十进制就是0~(1<<5 - 1);

2.描述不同状态如何转移:

放的状态只能从不放的状态转移过来，所以dp[10000]只能从dp[00000] + W[1] 转移过来；dp[11000]可以从

dp[01000] + W[1]或者dp[10000] + W[2]转移过来.........

3.按一个方向求出该问题的解

该问题并不是一个典型的动态规划问题，所以不用管；

代码如下：

#include<stdio.h>
const int INF = 1 << 15;
int dp[INF + 10];
int dp1[INF+ 10] ;	//定义状态 
void print1(int num);		//打印在状态为num的时候的所有物品放与不放的情况 

/*
3 6
2 5
3 8
4 9				//一组样例 

0       0       0
1       5       2
01      8       3
11      13      5
001     9       4
101     14      6
011     17      7
111     22      9
*/ 
int main()
{
	int n,m;
	while(~scanf("%d%d",&n,&m))
	{
		int W[20],C[20];
		for(int i = 0; i < n; i++)
		scanf("%d %d",&C[i],&W[i]) ;
		int res = -1;
		for(int i = 0; i < (1 << n); i++)
		{
			for(int j = 0; j < n; j++)
			{
				if(!(i&(1 << j)))		//状态转移 
				{
					int temp = i | (1<<j);
					dp[temp] = dp[i] + W[j];		
					dp1[temp] = dp1[i] + C[j];
					
				}
			}
		}
		for(int i = 0; i < (1 << n); i++)
		{
			print1(i);
			printf("\t%d\t%d\n",dp[i],dp1[i]);		//打印出每种方案的情况，价值 和耗费的空间 
		}
		
	}
	return 0;
}
void print1(int num)
{
	int k= 0;
	if(num == 0)
	printf("0");
	for(;(1 << k) <= num; k++)
	{
		if(num & (1<<k))
		printf("1");
		else
		printf("0");
	}
}

上面涉及到二进制运算的问题可以看另一篇博客位运算及常用功能；

从上面可以看出：状压dp的特点一般是规模比较小，n一般小于15。而且一般只有两种决策

————————————————————————————————————————————————————

例题1：POJ 2411

这个题规模比较小，而且每个方格只有两种状态，分别是被覆盖和未被覆盖；

所以我们考虑用状态压缩dp；

定义状态：

我们首先定义状态：dp[j][state]，表示能到达第j列，且第j列所有方格的覆盖情况为state时的所有方法数；

这样我们通过这个状态把这个问题分为j个阶段(j代表列数),因为第j列放置的情况最多只能影响到j+1列。比如第j列放置

一个或多个1*2的方格。这样一种情况就会影响到j+1列；但是他最多影响到第j+1列，之后就不能再影响了。

这就是无后效性；无后效性是保证能动态规划的关键。

状态转移：

当第i列第j行状态为0时，表示没有覆盖；当为1时，说明被覆盖了；

如果当前格没有被覆盖，说明我们至少可以放一个1*2的方格，如果当前列的下一行也没有被覆盖，那么我们可以放一个

2*1的方格；如果被覆盖，那么我们继续往当前列的下一行遍历，直到把这一列遍历完；在这个过程中，我们能求出

下一列的合法状态(也就是可以到达的状态)，这是一个搜索的过程，至于为什么要搜索，请看下面：

我们把当前列每一种状态都进行搜索，看能不能找到从这种状态到其他状态的一种路径；如果存在，说明其他状态是

可以到达的。所以我们其实并不需要对每一种状态进行搜索，只需要对可以到达的状态进行搜索即可；

按一个方向求出该问题的解：

当前阶段总是影响下一阶段，所以我们应该按照阶段的方向进行求解，在这个题中是按列的方向求解；题目要求全部填

满，所以答案应该是dp[m+1][0];

代码如下：

#include<stdio.h>
#include<string.h>
#define mmset(a,b) memset(a,b,sizeof(a))
const int INF = 1 << 12 + 10;
long long dp[13][2100];
int n,m;
/*
1 2
1 3
1 4
2 2
2 3
2 4
2 11
4 11
0 0
Sample Output
1
0
1
2
3
5
144
51205
*/


/*搜索从第j列的state状态开始，它能到达第j+1列的哪些状态；
  i代表第i行，next代表它能到达第j+1列的next状态 
*/
void dfs(int i,int j,int state,int next);		
											    
int main()
{
	
	while(~scanf("%d%d",&n,&m) && (n+m))
	{
		if(n > m)	//交换两个变量 
		{
			n = n ^ m;
			m = n ^ m;
			n = n ^ m; 
		}
		mmset(dp,0);	//初始化 
		dp[1][0] = 1;
		
		for(int j = 1; j <= m; j++)		//状态转移 
		{
			for(int state = 0; state < (1 << n); state++)
			{
				//对能达到的状态进行搜索，看该状态能不能达到其他状态；
				if(dp[j][state] > 0)	 
				{
					dfs(0,j,state,0);
				}
			}
		} 
		printf("%lld\n",dp[m+1][0]);		//输出答案 
		
		
	}
	return 0;
} 

void dfs(int i,int j,int state, int next)
{
	if(i == n)
	{
		/*
		注意dp[i][j]代表的含义，就知道为什么
		dp[j+1][next] += dp[j][state]
		*/
		dp[j+1][next] += dp[j][state];		
		return;								
	}
	else
	{
		if((state&(1 << i) )== 0)	//当该格子没被覆盖说明可以放一个1*2的木板 
		{
			dfs(i+1,j,state,next | (1<< i));
		}
		/*
		当该格子没被覆盖且它下面的格子也没被覆盖 
		说明可以当一个2*1的木板
		*/ 
		if(i + 1 < n &&(state & (1 << i)) == 0 && (state & (1 << (i+1))) == 0)	
		{																		
			dfs(i+2,j,state,next);
		}
		if((state & (1 << i)) > 0)	//当该格子被覆盖时，说明这个格子什么都不能放 
		{
			dfs(i+1,j,state,next);
		}
	}
}

————————————————————————————————————————————————————

例题2：POJ 3254

可以发现这个题有如下特征，规模较小，每个方格只有两种状态，可以种玉米和不可以种玉米；

仍然考虑用状压dp；

定义状态：

定义状态dp[i][state]表示能到达第i行，且第i行的所有的种玉米和不种玉米的情况为state时的所有状态数。

种玉米代表1，不种玉米代表0；

分析这个状态定义，发现这个状态定义把整个问题分成了n个阶段(代表行数)，并且这n个阶段遵循无后效性；

状态转移：

当前阶段只受前一阶段的影响，当前阶段只能影响到后一阶段。所以状态转移就是把握住当前状态是如何影响后一

阶段的。在这个题中，我们会发现：

如果当前阶段的某列土地种了玉米，那么下个阶段的这列土地就不能种玉米。

另外，如果当前阶段某列土地的前一列土地种了玉米，那么这一列就不能再种玉米了。

需要注意的是，如果当前阶段的某一列可以种玉米，你可以有两种选择，种或不种。

按一个方向求解：

可以看出这个状态定义是按行数分了n个阶段，所以我们应该按照行数来进行求解，根据状态定义，结果是把最后

一行的所有可达到的状态的方法数加和即可。

代码如下：

#include<stdio.h>
#include<string.h>
#define mmset(a,b) memset(a,b,sizeof(a))

const int INF = 1 << 12 + 5;
int   dp[15][INF];
int data[15][15];
int n,m;		//行列 

/*
2 3
1 1 1
0 1 0
Sample Output
9
*/


/*
i代表当前行 
j代表当前列
state代表当前行(阶段)的状态 
next代表下一行(阶段)的可到达状态
flag代表是上一列是否种了玉米，如果种了玉米，flag =  1,否则等于0； 
*/ 
void dfs(int i,int j,int state,int next,int flag);

int main()
{
	while(~scanf("%d%d",&n,&m))
	{
		for(int i = 1; i <= n; i++)
		{
			for(int j = 0; j < m; j++)
			{
				scanf("%d",&data[i][j]);
			}
		}
		mmset(dp,0);		//初始化 
		dp[0][0] = 1;	
		
		/*
			遍历每个阶段的所有可达到状态，并搜索这种状态所能到达所有状态 。
			这是状态转移的过程 
		*/ 
		for(int i = 0; i < n; i++)	
		{
			for(int state = 0; state < (1<<m); state++)
			{
				if(dp[i][state] > 0)
				{
					dfs(i,0,state,0,0);
				}
			}
		}
		int ans = 0;
		/*
			求解，对最后一行所有可达到的状态的方法数加和，并存在变量ans中; 
		*/ 
		for(int state = 0; state < (1<<m); state++)
		{
			if(dp[n][state] > 0)
			{
				ans=(ans+dp[n][state])%100000000;
			}
		}
		printf("%d\n",ans);
	}	
	
	return 0;
}

void dfs(int i,int j,int state,int next,int flag)
{
	if(j == m) 
	{
		dp[i+1][next] = (dp[i+1][next] + dp[i][state])%100000000;
	}
	/*
	下面这段代码有点绕，可以种玉米是指客观条件,
	但种不种玉米是主观意愿。 
	*/ 
	else
	{
		//表示可以种玉米 
		if(data[i+1][j] == 1 && (state & (1<<j)) == 0 && flag== 0) 
		{
			if(flag == 0||flag == 1)    //不种玉米 
			{
 				dfs(i,j+1,state,next,0);
			}
			if(flag == 0)	//种玉米 
			{
				dfs(i,j+1,state,next | (1<<j),1);
			}
		}
		//不可以种玉米 
		else
		{
			dfs(i,j+1,state,next,0);
		}
	}
}