问题
本题为 Google “Top Coder”850分例题。假设有这样一种字符串,它们的长度不大于 26,而且若一个这样的字符串其长度为 m ,则这个字符串必定由 a, b, c ... z中的前 m 个字母构成,同时保证每个字母出现且仅出现一次。比方说某个字符串长度为 5 ,那么它一定是由 a, b, c, d, e 这 5 个字母构成。一旦长度确定,这个字符串中有哪些字母也就确定了,唯一的区别就是这些字母的前后顺序而已。
现在我们用一个由大写字母 A 和 B 构成的序列来描述这类字符串里各个字母的前后顺序:如果字母 b 在字母 a 的后面,那么序列的第一个字母就是 A (After),否则序列的第一个字母就是 B (Before);如果字母 c 在字母 b 的后面,那么序列的第二个字母就是 A ,否则就是 B;如果字母 d 在字母 c 的后面,那么 ……
不用多说了吧?直到这个字符串的结束。
这规则甚是简单,不过有个问题就是同一个 AB 序列,可能有多个字符串都与之相符,比方说序列 “ABA”,就有 “acdb”、“cadb”等等好几种可能性。说的专业一点,这一个序列实际上对应了一个字符串集合。
那么现在问题来了:给你一个这样的 AB 序列,问你究竟有多少个不同的字符串能够与之相符?或者说这个序列对应的字符串集合有多大?注意,只要求个数,不要求枚举所有的字符串。
分析
在给定的 “ABABB…”序列中,计算 1~n级的情况 (n=序列长度 ),规则为“映射”。在本题目中,我们并不需要关心每级中包含元素是什么,而在于元素的个数。
假设现需要计算序列 “ABBAA”,0级只映射一个字符串 “a”,并且 a在 0位置; 1级的时候,序列字符为 ‘A’,说明 b在 a后面,只能映射一个字符串 “ab”,b在 1位置; 2级的时候,序列字符为 ‘B’,说明 c在 b前面,能够映射 “cab”, “acb”,分别在 0、1位置。以此类推,每级映射字符串数量计算如下表:
由上表可以看出,对于每一级的情况,我们需要记录两个信息:
- 本级能够影射的字符串数量;
- 最大字符所在位置(因为后序 AB序列只关心最大字符)。
综合起来,就是需要按照最后字符所在位置的不同,分别记录映射字符串的数量。
解法
按照分析思路,可以设置两个哈希表,一个记录 l级数据,一个用来保存 l+1级数据,计算一次后交换,代码如下:
for (int i = 1; i < n; i++) { foreach (var kvp in dic1) { int m = 0, M = i; if (ab[i - 1] == 'A') m = kvp.Key + 1; else M = kvp.Key; for (int j = m; j <= M; j++) { if (!dic2.ContainsKey(j))
dic2.Add(j, 0); dic2[j] += kvp.Value;
}
}
var temp = dic1; dic1 = dic2; dic2 = temp;
dic2.Clear();//交换两个字典
}
其中:
string ab = ABAB序列
n = ab.Length + 1;//映射的字符串长度为 "ABAB..."长度 + 1
dic1 = new Dictionary<int, double>(n);//key=字符出现的位置 value=字符串数量
dic2 = new Dictionary<int, double>(n);
初始化 dic1.Add(0, 1);讨论
在本题目中,由于只需要记录每级元素的数量,“分级组合(排列)法”非常有效。后续应用中,我们还将看到类似例子。
作者:Silver,原文链接:http://gpww.blog.163.com/blog/static/1182681642009961115383/
其他文章:连载1:卡特兰数(Catalan)