又是一道最优前缀树的应用,美团2020笔试题最后一道编程,。。。当时对最优前缀树还不是特别的了解,咩打出来。现在才发现最优前缀树是这么的方便好用。
最小唯一前缀
题目描述:
给定一组个字符串,为每个字符串找出能够唯一识别该字符串的最小前缀。
输入描述:
第一行输入一个整数 n 表示字符串个数
后面n行,每行一个字符串,一共n串互不相同的字符串。(2 <= n <= 100,字符串长度不超过100)
输出描述:
输出n行,每行一个字符串,依次是每个字符串的最小可唯一识别前缀
示例1
输入
5
meituanapp
meituanwaimai
dianpingliren
dianpingjiehun
mt
输出
meituana
meituanw
dianpingl
dianpingj
mt
【算法思想】
题目的要求是 :给定一组个字符串,为每个字符串找出能够唯一识别该字符串的最小前缀。因为我们要找到能具体区别出各个字符串的最短字符串,说明之前一定有重复。我们只需要找出第一个不重复的字符就可以了。 比如字符串s1 = “abcdfg” , 字符串s2 = “abcefg” 。我们可以找出, s1 = “abcd” , s2 = “abce” (因为"abc"都重复,区别不出来s1和s2,所以要找到公共串的第二个)。多个字符串的思想也是这里。
综上,用最优前缀树再合适不过了。我们定义每个节点的带有的cnt标记值的初始都是1,当很多字符串都经历这个节点的时候,我们可以对这个节点的标记值cnt++。
构建完最优前缀树之后,我们只要按着每一个字符串遍历,遍历到第一个 cnt==1的位置,表示这个节点只有一个字符串的字符到过,所以以这个字符结尾的字符串肯定就是一个答案。我们将所有字符串的答案都找出即可。
代码实现:
#include <iostream>
#include <vector>
#include <string>
using namespace std;
struct Node
{
int cnt;
Node* next[26]; //26个小写的字母 a-z
Node() // 对于最优前缀树的每个节点都要将指 指针数组初始化为nullptr, 每一个cnt都要初始化为1
:cnt(1)
{
for (int i = 0; i < 26; i++)
{
next[i] = nullptr;
}
}
};
int main()
{
Node*root = new Node();
int n = 0;
cin >> n;
vector<string> strs(n);
for (int i = 0; i < n; i++)
{
string tmp;
cin >> tmp; //对于每一个输入的字符串,就构造前缀树,加入七十中
strs[i] = tmp;
Node* p = root;
for (int j = 0; j < tmp.size(); j++)
{
if (p->next[tmp[j] - 'a'] != nullptr) // 节点的下一个 next[tmp[j] - 'a']不为空
{
p->next[tmp[j] - 'a']->cnt++; // 对这个节点的标记值 cnt++
}
else
{
p->next[tmp[j] - 'a'] = new Node(); //创建新的节点
}
p = p->next[tmp[j] - 'a']; // 将指针指向 下一个节点
}
}
for (int i = 0; i < n; i++)
{
Node* p = root;
int j = 0;
for (; j < strs[i].size(); j++)
{
if (p->next[strs[i][j] - 'a']->cnt == 1)
{
cout << strs[i].substr(0, j + 1) << endl; // 输处从头结点到 cnt=1位置的整个字符
break;
}
p = p->next[strs[i][j] - 'a'];
}
if (j == strs[i].size()) // 代表整个字符串才是唯一可区分的
{
cout << strs[i] << endl;
}
}
system("pause");
}