问题重述:
Consider the aggregate An= { 1, 2, …, n }. For example, A1={1}, A3={1,2,3}. A subset sequence is defined as a array of a non-empty subset. Sort all the subset sequece of An in lexicography order. Your task is to find the m-th one.
Lexicography order 的意思是字典排序,所谓字典排序就是“大小优先,长度递增”的排序策略,给一个例子就可以理解了。
A3 = { 1, 2, 3}
所以:A1 = {1}, A2 = { 1,2},A3 = {1,2,3},A4 = {1,3},A5={1,3,2},...,A15={3,2,1}
问题求解:
设f(n)为An中的Subset Sequence个数,这里 f(1)=1. 经过枚举,f(2) = 4, f(3) = 15.
∴ f(n) = n(f(n - 1) + 1)
根据字典排序的性质,我们可以把不同开头的Subset划分到一组当中,每组的Subsets个数,也就是相同开头数字的组中,Subsets个数是一致的。如果An集合的互异数字个数为n,那么令组内子集数目为g(n),那么g(n) = f(n)/n。根据上述推导,得出如下的状态转移方程:g(n) = (n - 1)g(n - 1) + 1. 以测试数据n = 3,m = 10为例:f(3) = 15, g(3) = 5.
10/g(3) = 2 …… 0 没有余数,所以第十个子集位于第二组中,所以第一个数字为2。对于这个计算结果,如果余数不为零的情况下则进行向上取整,这个判断过程的数学表达如下:
令组数为epsl,epsl = m/g(n) + (m%g(n) == 0?0 : 1);
删去第二组以前的所有Subsets,10 - (2 - 1)*5 = 5. 去掉2本身之后有 5 - 1 = 4 != 0,说明2的后面还有数字。去掉2之后,A3集合中还有两个数1和3. 迭代至下一层后f(2) = 4,g(2) = 2.
这时的epsl = 2, 位于第二组中,所以第二个数为3,4 - (2 - 1)* 2 - 1 = 1 != 0,结果不为零,说明3后面还有一个数字。
以此类推,A10 = {2,3,1}为正确的输出结果,经枚举验证之后,该算法的运行结果正确。
AC Codes in C++:
#include<iostream>
//#include<string>
using namespace std;
//#include<cmath>
_int64 g[21];
_int64 arr[21];
void CantorInit() //打表初始化
{
g[0] = 0;
g[1] = 1;
for (int i = 1; i < 21; i++)
{
g[i] = (i - 1)*g[i - 1] + 1;
}
}
int main()
{
CantorInit();
int n;
_int64 m;
while (cin>>n>>m)
{
for (int i = 1; i < 21; i++)
{
arr[i] = i;
}
while (n>0 && m>0)
{
int epsl = m / g[n] + (m%g[n] == 0 ? 0 : 1);
if (epsl > 0)
{
cout << arr[epsl];
for (int i = epsl; i <= n; i++)
{
arr[i] = arr[i + 1];
}
m = m - (epsl - 1)*g[n] - 1;
if (m != 0)
{
cout << " ";
}
else
{
cout << '\n';
}
}
n--;
}
}
//system("pause");
return 0;
}