题目:输入一个字符串数组words,请计算不包含相同字符的两个字符串word[i]和word[j]的长度乘积的最大值。如果所有字符串都包含至少一个相同字符,那么返回0.假设字符串中只包含英文小写字母。例如,输入的字符串数组words为["abcw","foo","bar","fxyz","abcdef"],数组中的字符串"bar"与"foo"没有相同的字符,它们长度的乘积为9。"abcw"与"fxyz"也没有相同的字符,它们长度的乘积为16,这是该数组不包含相同字符的一对字符串的长度乘积的最大值。
比较大小是不难的,所以这道题的核心是如何判断两个字符串中是否有相同字符,一种暴力解决方案是基于其中一个字符串里的每个字符,扫描判断在另一个字符串中是否存在。假设两个字符串长度分别为p、q,则判断两个字符串是否包含相同的字符的时间复杂度为O(pq)。
用哈希表记录字符串中出现的字符
判断两个字符串中是否有相同字符,只需判断某个字符是否在对应的哈希表中都出现了。所有字符均为小写字母,所以最多只需在哈希表中查询26次,其为常数,因此可以认为,应用哈希表后判断两字符串是否包含相同的字符的时间复杂度为O(1)。
我们可以用一个长度为26的布尔型数组来模拟哈希表,代码如下:
public int maxProduct(String[] words) {
//用一个二维数组模拟哈希表存放各个字符串里字符存在情况,默认为false
boolean[][] flags = new boolean[words.length][26];
//遍历字符串
for (int i = 0; i < words.length; i++) {
//遍历字符
for (char c : words[i].toCharArray()) {
//存在设为true
flags[i][c - 'a'] = true;
}
}
//保存满足条件的乘积值
int result = 0;
//遍历字符串
for (int i = 0; i < words.length; i++) {
//遍历其后面字符串,
for (int j = i + 1; j < words.length; j++) {
//记录比较次数
int k = 0;
//遍历两字符串内的字符
for (; k < 26; k++) {
//若存在相同字符,即在flags二维数组中,这两行(两字符串)存在某一列(某一字符)均为true(相同),则跳出循环
if (flags[i][k] && flags[j][k]) {
break;
}
}
//k=26说明比较了26次,则表示两字符串不包含相同字符
if (k == 26) {
int prod = words[i].length() * words[j].length();
//保存最大的结果
result = Math.max(result, prod);
}
}
}
return result;
}
假设数组words长度为n,平均每个字符串长度为k,则创建哈希表的时间复杂度为O(nk)。总共有n^2对字符串,每对字符串判断需要的时间为O(1),,则判断每对字符串是否包含相同的字符的时间复杂度为O(n^2)。总体时间复杂度为O(nk+n^2)。每个字符串创建了一个长度为26的数组,数组words长度为n,所以总体空间复杂度为O(n)。
用整数的二进制数位记录字符串中出现的字符
方法一是用长度为26的布尔型数组记录字符串,存在与否,用true和false表示,类似的我们可以用26个二进制数位表示,存在与否,用0和1表示。
public int maxProduct(String[] words) {
//创建二维数组,其元素的二进制形式记录对应字符串字符的存在情况
int[] flags = new int[words.length];
for (int i = 0; i < words.length; i++) {
for (char ch : words[i].toCharArray()) {
//核心:将存在的字符对应的数位置为1
flags[i] |= 1 << (ch - 'a');
}
}
int result = 0;
for (int i = 0; i < words.length; i++) {
for (int j = i + 1; j < words.length; j++) {
//若两个整数的相同的某个数位都为1,与运算结果不会等于0
if ((flags[i] & flags[j]) == 0) {
int prod = words[i].length() * words[j].length();
result = Math.max(result, prod);
}
}
}
return result;
}
如果数组words长度为n,平均每个字符串长度为k,那么时间复杂度为O(nk+n^2),空间复杂度为O(n),但在判断两个字符串是否包含相同的字符时,前一个方法可能要做26次布尔运算,而方法二只需一次位运算。所以方法二的时间效率更高。