无意看到一道阿里巴巴的算法题,题目如下:
字符串数组seq[] = a,b,c,d,aa,ba,ca,da,ab,bb,cb,db,ac...,aaa,aba,...
(1)aaa是第几个字符串
(2)ababacd是第几个
(3)第1000个字符串是什么
(4)编写函数find(),返回字符串在seq中是第几个(语言不限)
网上有很多答案,大多千篇一律的错误解答如下:
错误分析结果:
(1).长度,很容易推导出长度是n的字符串在第4^(n-1)个之后,aaa是1位和2位全排列后的第一个,即第4^(3-1)+4^(2-1)之后的第一个,也即第21个。
(2)字符,每个字符可以判断出它之前的字符全排列了多少次,
字 符: a b a b a c d
全排列: 0 1 0 1 0 2 3
4^次幂: 0 1 2 3 4 5 6
即1*4^1+1*4^3+2*4^5+3*4^6 = 14405(考场不让用计算器...换成2的次幂来算)。
(3)把1000转为二进制是 11 11 10 10 00,
他们分别对应4进制里的 3 3 2 2 0,
对应字符就是 d d c c a,倒序就是accdd,这里算出来的是1001的字符串,
第1000个是上一个, 即 accdd-1 = dbcdd。
实在不忍看下去了,估计都是转载的答案。很显然以上解答只有第(1)小题是对的。想一下,若字符串为“aaa”,那么按(2)的思路思考的话, 那么他应该是序列seq中的第一个,这显然是不对的,也与第(1)小题矛盾了。
正确解答:
(1) 对于一个长度为n的字符串序列,且字符串中每个字符串取值于集合{a, b, c, d},很显然有4^n种排列方式,这应该是高中排列、组合中就讲过的内容,不解释了。
seq是包含所有长度从1……n的字符串数组,“aaa"是n=3时,所有排列的第一个元素,因此是4^1 + 4^2 + 1 = 21,即为第21个元素。
(2) 对于所有长度为n的字符,每个字符可以判断出它之前的字符全排列了多少次,
字 符: a b a b a c d
全排列: 0 1 0 1 0 2 3
4^次幂: 0 1 2 3 4 5 6
即1*4^1+1*4^3+2*4^5+3*4^6 = 14405
这并不是"ababacd"在seq中的最终位置,还应当加上所有长度小于n的字符数组的个数,即4^1+……+4^6 + 14405 = 19865
(3) 4^1+……+4^4 < 1000 < 4^1+……+4^5,因此,第1000个字符串的长度肯定为n = 5;第1000个字符串在seq中的实际下标为999,因此999-340=659,659的二进制表示为1010010011,倒序之后就是"dabcc"
(4) 代码如下:
#include <iostream>
#include <string>
using namespace std;
double find(string str)
{
double sum = 1;//字符串数组从下标0开始
int len = strlen(str.c_str());
for (int i = 1; i < len; ++ i)//注意此处的求和范围
{
sum += (double)pow(4, i);
}
for (int i = 0; i < len; ++ i)
{
sum += (str[i] - 'a') * (double)pow(4, i);
}
return sum;
}
int main()
{
cout << find("aaa") << endl;
cout << find("ababacd") << endl;
cout << find("dabcc") << endl;
system("pause");
return 0;
}