#include <vector>
#include<cstring>
#include<iostream>
#include <set>
#include <algorithm>
using namespace std;
#define INF 1000000;
//引用只是纯粹的一个变量的别名,至于怎么做到的和指针无关,和语言设计方法有关,待深究;
typedef struct node{
char c;
node *firstchild,*nextsibling;
node():c('\0'),firstchild(NULL),nextsibling(NULL){}
}node,*pointer;
/* 指针版本的左孩子,右兄弟表示法;
插入元素和查找元素的速度为最坏情况下 26*strlen(str);
但对于遍历整棵树而言花费时间代价很低;
*/
struct Trie{
pointer root;
Trie(){root=new node();}
void insert(char* s,int i,int n,pointer& root){
if(i==n) return ;
pointer u=root; //必须用一个新指针,不然下面操作改变了root的指向;
if(u!=NULL) while(u->nextsibling!=NULL&&u->c!=s[i]) u=u->nextsibling;
if(u==NULL||u->nextsibling==NULL&&u->c!=s[i]){
pointer& v = (u==NULL ? root:u->nextsibling);//NULL时必须赋值为root,因为要改变该指针的指向;
v=new node();
v->c=s[i];
insert(s,i+1,n,v->firstchild);
}
else insert(s,i+1,n,u->firstchild);
}
void Insert(char* s){
int n=strlen(s);
insert(s,0,n,root);
}
bool find(char* s,int i,int n,pointer& root){
if(i==n) return true;
pointer u=root;
if(u==NULL) return false;
while(u->nextsibling!=NULL&&u->c!=s[i]) u=u->nextsibling;
if(u->nextsibling==NULL&&u->c!=s[i]) return false;
return find(s,i+1,n,u->firstchild);
}
bool Find(char* s,int n){
return find(s,0,n,root);
}
};
int main()
{
char str[1000];
Trie trie;
while(gets(str)!=NULL&&str[0]!='#'){
trie.Insert(str);
}
while(gets(str)!=NULL){
if(trie.Find(str,strlen(str))) printf("find\n");
else printf("not find\n");
}
return 0;
}
上述插入和建树用的是递归的方式;
而循环版本并不好写(每到一个结点都是站在结点的孩子头上,而不是父亲指针那里,所以写起来很麻烦),因为同s[i] -- > s[i+1] 下一次要用的指针必须为某个特定指针,只能通过递归传引用
void insert(char* s,int n){pointer& Root=root;for(int i=0;i<n;i++){ pointer u=Root; if(u!=NULL)while(u->nextsibling!=NULL&&u->c!=s[i]) u=u->nextsibling; if(u==NULL||u->nextsibling==NULL&&u->c!=s[i]){ pointer& v=(u==NULL ? Root:u->nextsibling); v=new node(); v->c=s[i]; Root=v->firstchild; } else Root=u->firstchild;(这样的写法错误,因为Root为根结点的引用,对它的修改即修改了根结点)}}
每次都站在父节点上考虑,就好写多,下面为指针--循环版;
#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
typedef struct node{
char c;
node *firstchild,*nextsibling;
node():c('\0'),firstchild(NULL),nextsibling(NULL){}
}node,*pointer;
struct Trie{
pointer root;
Trie(){root=new node();}
void insert(char* s,int n){
pointer u=root;
for(int i=0;i<n;i++){
pointer v=u->firstchild;
if(v!=NULL) while(v->nextsibling!=NULL&&v->c!=s[i]) v=v->nextsibling;
if(v==NULL||v->nextsibling==NULL&&v->c!=s[i]){
pointer& p=(v==NULL ? u->firstchild:v->nextsibling);
p=new node();
p->c=s[i];
u=p;
}
else u=v;
}
}
bool find(char* s,int n){
pointer u=root;
for(int i=0;i<n;i++){
pointer v=u->firstchild;
if(v==NULL) return false;
while(v->nextsibling!=NULL&&v->c!=s[i]) v=v->nextsibling;
if(v->nextsibling==NULL&&v->c!=s[i]) return false;
u=v;
}
return true;
}
};
int main()
{
char str[1000];
Trie trie;
while(gets(str)!=NULL&&str[0]!='#'){
trie.insert(str,strlen(str));
}
while(gets(str)!=NULL){
if(trie.find(str,strlen(str))) printf("find\n");
else printf("not find\n");
}
return 0;
}
pointer p=p1; 指针p的指向与p1相同(对p而言,指向改变,而对p1而言多了一个和他指向同一块内存区域的指针);
pointer& p=p1;对p1而言多了一个可以用的名字;
第三点,就是改变发生的情况不同。
下面为左孩子,右兄弟的数组表示方法
#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
struct Trie{
static const int maxn = 100001;
Trie():tot(2){
memset(firstchild,0,sizeof(firstchild));
memset(nextsibling,0,sizeof(nextsibling));
memset(c,0,sizeof(c));
}
char c[maxn];
int firstchild[maxn],nextsibling[maxn],tot;
void insert(char* s,int n){
int u=1;
for(int i=0;i<n;i++){
int v=firstchild[u];
if(v!=0) while(nextsibling[v]!=0&&c[v]!=s[i]) v=nextsibling[v];
if(!v||nextsibling[v]==0&&c[v]!=s[i]){
int& p=(v==0 ? firstchild[u]:nextsibling[v]);
p=tot;
c[tot]=s[i];
u=tot++;
}
else u=v;
}
}
bool find(char* s,int n){
int u=1;
for(int i=0;i<n;i++){
int v=firstchild[u];
if(!v) return false;
while(nextsibling[v]!=0&&c[v]!=s[i]) v=nextsibling[v];
if(nextsibling[v]==0&&c[v]!=s[i]) return false;
else u=v;
}
return true;
}
};
int main()
{
char str[1000];
Trie trie;
while(gets(str)!=NULL&&str[0]!='#'){
trie.insert(str,strlen(str));
}
while(gets(str)!=NULL){
if(trie.find(str,strlen(str))) printf("find\n");
else printf("not find\n");
}
return 0;
}
下面为用孩子数组实现的版本
#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
/*
孩子数组表示法
(即将每个结点的孩子存下来,图是用标号链接的每个结点的内容,用附加数组表示)
本表示方法的试用于总结点数(maxn)较少的情况;
遍历整棵树非常费时,
但在插入和查找的时候是o(strlen(str))的时间;
*/
struct Trie{
static const int maxn = 10000;
static const int sigma_size = 27;
int tot,c[maxn],son[maxn][sigma_size];
Trie():tot(2){memset(son,-1,sizeof(son));}
void insert(char* s,int n){
int u=1;
for(int i=0;i<n;i++){
int word=s[i]-'a';
if(son[u][word]==-1){
son[u][word]=tot;
u=tot++;
}
else u=son[u][word];
}
}
bool find(char* s,int n){
int u=1;
for(int i=0;i<n;i++){
int word=s[i]-'a';
if(son[u][word]==-1) return false;
u=son[u][word];
}
return true;
}
};
int main()
{
char str[1000];
Trie trie;
while(gets(str)!=NULL&&str[0]!='#'){
trie.insert(str,strlen(str));
}
while(gets(str)!=NULL){
if(trie.find(str,strlen(str))) printf("find\n");
else printf("not find\n");
}
return 0;
}