题目
编写一个函数来查找字符串数组中的最长公共前缀。
如果不存在公共前缀,返回空字符串 “”。
示例 1:
输入: [“flower”,“flow”,“flight”]
输出: “fl”
示例 2:
输入: [“dog”,“racecar”,“car”]
输出: “”
解释: 输入不存在公共前缀。
说明:所有输入只包含小写字母 a-z 。
横向扫描
用LCP(S1…Sn) 表示字符串S1…Sn的最长公共前缀。
可以得到以下结论:
LCP(S1…Sn)=LCP(LCP(LCP(S1,S2),S3),…Sn)
基于该结论,可以得到一种查找字符串数组中的最长公共前缀的简单方法。依次遍历字符串数组中的每个字符串,对于每个遍历到的字符串,更新最长公共前缀,当遍历完所有的字符串以后,即可得到字符串数组中的最长公共前缀。
如果在尚未遍历完所有的字符串时,最长公共前缀已经是空串,则最长公共前缀一定是空串,因此不需要继续遍历剩下的字符串,直接返回空串即可。
class Solution
{
public:
string longestCommonPrefix(vector<string>& strs)
{
if (!strs.size()) // 判断非空
{
return "";
}
string prefix = strs[0]; // 获取第一个字符串
int count = strs.size(); // 字符串的个数
for (int i = 1; i < count; ++i) // 依次遍历每个字符串
{
prefix = longestCommonPrefix(prefix, strs[i]); // 更新最长公共前缀
if (!prefix.size()) // 若在尚未遍历完所有字符串时,最长公共前缀已经是空串
{
break; // 则最长公共前缀一定是空串,则直接退出
}
}
return prefix; // 得到最长公共前缀
}
string longestCommonPrefix(const string& str1, const string& str2)
{
int length = min(str1.size(), str2.size()); // 取长度最小的为字符串
int index = 0; // 最长公共前缀最后一个字符的位置
// 最长公共前缀要小于两个字符串最小长度,并且两个字符串中的字符要相等
while (index < length && str1[index] == str2[index])
{
++index; // 继续往下比较
}
return str1.substr(0, index); // 得到两个字符串的最长公共前缀
}
};
复杂度分析
时间复杂度:O(mn),其中m是字符串数组中的字符串的平均长度,n是字符串的数量。最坏情况下,字符串数组中的每个字符串的每个字符都会被比较一次。
空间复杂度:O(1)。使用的额外空间复杂度为常数。
纵向扫描
纵向扫描时,从前往后遍历所有字符串的每一列,比较相同列上的字符是否相同,如果相同则继续对下一列进行比较,如果不相同则当前列不再属于公共前缀,当前列之前的部分为最长公共前缀。
class Solution
{
public:
string longestCommonPrefix(vector<string>& strs)
{
if (!strs.size()) // 判断非空
{
return "";
}
int length = strs[0].size(); // 获取第一个字符串总长度
int count = strs.size(); // 获取字符串个数
for (int i = 0; i < length; ++i) // 横向遍历
{
char c = strs[0][i]; // 获取第一个字符串中的字符
for (int j = 1; j < count; ++j) // 纵向遍历
{
// 一列遍历完或者相同列上的字符不同
if (i == strs[j].size() || strs[j][i] != c)
{
return strs[0].substr(0, i); // 则当前列之前的部分为最长公共前缀
}
}
// 相同则继续对下一列进行比较
}
return strs[0]; // 得到最终的最长公共前缀
}
};
复杂度分析
时间复杂度:O(mn),其中m是字符串数组中的字符串的平均长度,n是字符串的数量。最坏情况下,字符串数组中的每个字符串的每个字符都会被比较一次。
空间复杂度:O(1)。使用的额外空间复杂度为常数。
分治
注意到LCP 的计算满足结合律,有以下结论:
LCP(S1…Sn)=LCP(LCP(S1…Sk),LCP(Sk+1…Sn))
其中LCP(S1…Sn) 是字符串S1…Sn的最长公共前缀,1 < k < n1<k<n。
基于上述结论,可以使用分治法得到字符串数组中的最长公共前缀。对于问题LCP(Si⋯Sj),可以分解成两个子问题 LCP(Si…Smid) 与 LCP(Smid+1…Sj),其中mid=(i+j)/2 。对两个子问题分别求解,然后对两个子问题的解计算最长公共前缀,即为原问题的解。
class Solution
{
public:
string longestCommonPrefix(vector<string>& strs)
{
if (!strs.size()) // 判断非空
{
return "";
}
else
{
return longestCommonPrefix(strs, 0, strs.size() - 1); // 得到最长公共前缀
}
}
string longestCommonPrefix(const vector<string>& strs, int start, int end)
{
if (start == end) // 只有一个字符串
{
return strs[start]; // 直接返回该字符串
}
else
{
int mid = (start + end) / 2; // 将字符串数组分成2份
string lcpLeft = longestCommonPrefix(strs, start, mid); // 左边
string lcpRight = longestCommonPrefix(strs, mid + 1, end); // 右边
return commonPrefix(lcpLeft, lcpRight); // 进行递归
}
}
string commonPrefix(const string& lcpLeft, const string& lcpRight)
{
int minLength = min(lcpLeft.size(), lcpRight.size()); // 取两边最小长度
for (int i = 0; i < minLength; ++i) // 遍历
{
if (lcpLeft[i] != lcpRight[i]) // 比较两边的字符
{
return lcpLeft.substr(0, i); // 直到不同时,直接返回
}
}
return lcpLeft.substr(0, minLength); // 取出当前最长公共前缀
}
};
复杂度分析
时间复杂度:O(mn),其中m是字符串数组中的字符串的平均长度,n是字符串的数量。时间复杂度的递推式是 T(n)=2⋅T(n/2)+O(m),通过计算可得 T(n)=O(mn)
空间复杂度:O(mlogn),其中m是字符串数组中的字符串的平均长度,n是字符串的数量。空间复杂度主要取决于递归调用的层数,层数最大为logn,每层需要m的空间存储返回结果。
二分查找
显然,最长公共前缀的长度不会超过字符串数组中的最短字符串的长度。用 minLength表示字符串数组中的最短字符串的长度,则可以在 [0,minLength] 的范围内通过二分查找得到最长公共前缀的长度。每次取查找范围的中间值mid,判断每个字符串的长度为mid的前缀是否相同,如果相同则最长公共前缀的长度一定大于或等于mid,如果不相同则最长公共前缀的长度一定小于mid,通过上述方式将查找范围缩小一半,直到得到最长公共前缀的长度。
class Solution
{
public:
string longestCommonPrefix(vector<string>& strs)
{
if (!strs.size()) // 判断非空
{
return "";
}
int minLength = min_element(strs.begin(), strs.end(), [](const string& s, const string& t) {return s.size() < t.size();})->size();
int low = 0, high = minLength; //
while (low < high) // 二分法
{
int mid = (high - low + 1) / 2 + low;
if (isCommonPrefix(strs, mid))
{
low = mid;
}
else
{
high = mid - 1;
}
}
return strs[0].substr(0, low);
}
bool isCommonPrefix(const vector<string>& strs, int length)
{
string str0 = strs[0].substr(0, length);
int count = strs.size(); // 获取字符串个数
for (int i = 1; i < count; ++i) //
{
string str = strs[i];
for (int j = 0; j < length; ++j)
{
if (str0[j] != str[j])
{
return false;
}
}
}
return true;
}
};
复杂度分析
时间复杂度:O(mnlogm),其中m是字符串数组中的字符串的最小长度,n是字符串的数量。二分查找的迭代执行次数是 O(logm),每次迭代最多需要比较mn个字符,因此总时间复杂度是O(mnlogm)。
空间复杂度:O(1)。使用的额外空间复杂度为常数。