问题描述
给你一个二进制字符串数组 strs
和两个整数 m
和 n
。
请你找出并返回 strs
的最大子集的长度,该子集中 最多 有 m
个 0
和 n
个 1
。
如果 x
的所有元素也是 y
的元素,集合 x
是集合 y
的 子集 。
提示:
1 <= strs.length <= 600
1 <= strs[i].length <= 100
strs[i]
仅由'0'
和'1'
组成1 <= m, n <= 100
问题分析
该问题本质上仍属于0-1背包问题,只不过背包的容量是二维的,即0
和1
数目的限制,因此需要使用三维动态规划求解,三个维度分别是字符数组中的字符串、0
的容量和 1
的容量。
对于背包问题,可按下图分类:
dp定义
定义三维数组dp
,dp[i][j][k]
表示前i
个字符串中,使用不超过j
个0
和k
个1
的情况下最大的子集数(最多选多少个字符串)。假设数组strs
的长度为l
,则最终答案为 dp[l][m][n]
。
边界条件
当i=0
时,对任意 0≤j≤m
和0≤k≤n
都有 dp[i][j][k]=0
因为此时没选任何字符串;
建立状态转移方程
遍历每个字符串:
计算得到第i
个字符串的0,1
数量分别为num_0
,num_1
遍历0
容量
遍历1
容量
若j<num_0
或k<num_1
则不能选当前字符串, dp[i][j][k] = dp[i-1][j][k]
若j>=num_0
或k>=num_1
,选“不选和选中的最大值”, dp[i][j][k]=max(dp[i-1][j][k],dp[i-1][j-num_0][k-num_1]+1)
d
p
[
i
]
[
j
]
[
k
]
=
{
d
p
[
i
−
1
]
[
j
]
[
k
]
,
j
<
zeros
∣
k
<
ones
max
(
d
p
[
i
−
1
]
[
j
]
[
k
]
,
d
p
[
i
−
1
]
[
j
−
zeros
]
[
k
−
ones
]
+
1
)
,
j
≥
zeros
&
k
≥
ones
d p[i][j][k]=\left\{\begin{array}{ll} d p[i-1][j][k], & j<\text { zeros } \mid k<\text { ones } \\ \max (d p[i-1][j][k], d p[i-1][j-\text { zeros }][k-\text { ones }]+1), & j \geq \text { zeros } \& k \geq \text { ones } \end{array}\right.
dp[i][j][k]={dp[i−1][j][k],max(dp[i−1][j][k],dp[i−1][j− zeros ][k− ones ]+1),j< zeros ∣k< ones j≥ zeros &k≥ ones
空间复杂度
O
(
l
m
n
)
O(lmn)
O(lmn)
class Solution {
public int findMaxForm(String[] strs, int m, int n) {
int length = strs.length;
int[][][] dp = new int[length + 1][m + 1][n + 1];
for (int i = 1; i <= length; i++) {
int[] zerosOnes = getZerosOnes(strs[i - 1]);
int zeros = zerosOnes[0], ones = zerosOnes[1];
for (int j = 0; j <= m; j++) {
for (int k = 0; k <= n; k++) {
dp[i][j][k] = dp[i - 1][j][k];
if (j >= zeros && k >= ones) {
dp[i][j][k] = Math.max(dp[i][j][k], dp[i - 1][j - zeros][k - ones] + 1);
}
}
}
}
return dp[length][m][n];
}
public int[] getZerosOnes(String str) {
int[] zerosOnes = new int[2];
int length = str.length();
for (int i = 0; i < length; i++) {
zerosOnes[str.charAt(i) - '0']++;
}
return zerosOnes;
}
}
优化空间复杂度
滚动数组——Trick倒序遍历优化
外层循环确定遍历的物品,内层从后向前遍历,可以省去i
维度,变成dp[j][k]
。
为什么要进行倒序遍历?回到初始的状态表达式:
d
p
[
i
]
[
j
]
[
k
]
=
{
d
p
[
i
−
1
]
[
j
]
[
k
]
,
j
<
zeros
∣
k
<
ones
max
(
d
p
[
i
−
1
]
[
j
]
[
k
]
,
d
p
[
i
−
1
]
[
j
−
zeros
]
[
k
−
ones
]
+
1
)
,
j
≥
zeros
&
k
≥
ones
d p[i][j][k]=\left\{\begin{array}{ll} d p[i-1][j][k], & j<\text { zeros } \mid k<\text { ones } \\ \max (d p[i-1][j][k], d p[i-1][j-\text { zeros }][k-\text { ones }]+1), & j \geq \text { zeros } \& k \geq \text { ones } \end{array}\right.
dp[i][j][k]={dp[i−1][j][k],max(dp[i−1][j][k],dp[i−1][j− zeros ][k− ones ]+1),j< zeros ∣k< ones j≥ zeros &k≥ ones
dp[i][][]
的确定与dp[i-1][][]
有关,且数组中靠后的数据会利用到靠前的数据。也就是说需要有记忆地存储dp[i-1][][]
的数据,当我们省去i
维度后,dp[j][k]
即代表了当前的字符串的dp[i][j][k]
。
如果正序遍历,j
和k
递增,则注定修改过的dp[j][k]
会进入到后续的比较中,即dp[i][j][k]=max(dp[i-1][j][k],dp[i-1][j-num_0][k-num_1]+1)
中的dp[i-1][j][k]
实际已经变成了dp[i][j][k]
,破坏了所需要的记忆存储;
如果倒序遍历,靠后的数据修改后不破坏前面数据对于dp[i-1][j][k]
的存储。
![[fig_474.png]]
class Solution {
public int findMaxForm(String[] strs, int m, int n) {
int[][] dp = new int[m+1][n+1];
for(int i=0;i<strs.length;i++)// 数组是引用数据类型不是类,长度用length属性
{
int num_0=0,num_1=0;
for(int j=0;j<strs[i].length();j++)// 字符串是String类,用length()方法
{
if(strs[i].charAt(j)=='0') num_0++; //String的元素
if(strs[i].charAt(j)=='1') num_1++;
}
for(int k=m;k>=num_0;k--){
for(int v=n;v>=num_1;v--)
{
dp[k][v] = Math.max(dp[k][v],dp[k-num_0][v-num_1]+1);
}
}
}
return dp[m][n];
}
}
该方法空间复杂度为 O ( m n ) O(mn) O(mn)