计算字符串最长公共前缀
解法之一:利用字典树
(Trie,又称前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串。键由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。一般情况下,不是所有的节点都有对应的值,只有叶子节点和部分内部节点所对应的键才有相关的值。trie中的键通常是字符串,但也可以是其它的结构。trie的算法可以很容易地修改为处理其它结构的有序序列,比如一串数字或者形状的排列。)
算法
将这些字符串储存到字典树中,树的第一个分叉口之前的单分支树即为所求。
模板
const int C = 26;
const int N = 1e4;
struct Node {
int son[C], cnt;//记录以该节点为末尾的字符串个数
};
struct Trie {
Node no[N];
int tol;
// 初始化
void init() { tol = 0; newNode(); }
// 新建节点
int newNode()
{
memset(no[tol].son, 0, sizeof(no[tol].son));
no[tol].cnt = 0;
return tol++;
}
// 插入字符串
void insert(char s[])
{
int cur = 0;
for(int i = 0; s[i]; i++) {
int &son = no[cur].son[s[i]-'a'];
if(!son) son = newNode();
cur = son;
no[cur].cnt++;
}
}
};
例题(HDU1251)
Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.
注意:本题只有一组测试数据,处理到文件结束.
Output
对于每个提问,给出以该字符串为前缀的单词的数量.
Sample Input
banana
band
bee
absolute
acm
ba
b
band
abc
Sample Output
2
3
1
0
AC:
#include<iostream>
#include<cstring>
using namespace std;
const int C = 26;
const int N = 1e4;
struct Node {
int son[C], cnt;//记录以该节点为末尾的字符串个数
};
struct Trie {
Node no[N];
int tol;
// 新建节点
int newNode()
{
memset(no[tol].son, 0, sizeof(no[tol].son));
no[tol].cnt = 0;
return tol++;
}
// 初始化
void init() { tol = 0; newNode(); }
// 插入字符串
void insert(char s[])
{
int cur = 0;
for(int i = 0; s[i]; i++)
{
int &son = no[cur].son[s[i]-'a'];
if(!son)
son = newNode();
cur = son;
no[cur].cnt++;
}
}
int find(char t[])
{
int cur=0;
for(int i=0;t[i];i++)
{
cur=no[cur].son[t[i]-'a'];
}
return no[cur].cnt;
}
}tree;
int main()
{
tree.init();
char str[10];
while(gets(str))
{
if(str[0]==NULL)
break;
tree.insert(str);
}
char st[10];
while(gets(st)){
cout<<tree.find(st)<<endl;
}
return 0;
}
Trie详解请参考博客:Trie(前缀树/字典树)及其应用