字典树的姿势

姿势1:静态数组形式

struct Trie  
{  
    int ch[maxnode][sigema_size],val[maxnode],sz;  
    Trie() {sz=1;memset(ch[0],0,sizeof(ch[0]));memset(val,-1,sizeof(val));}  
    void insert(bign s,int v)  
    {  
        int u=0;  
        for(int i=s.len-1;i>=max(s.len-41,0);--i)  
        {  
            int c=s.d[i];  
            if(!ch[u][c])  
            {  
                memset(ch[sz],0,sizeof(ch[sz]));  
                if(val[sz]==-1) val[sz]=v;  
                ch[u][c]=sz++;  
            }  
            u=ch[u][c];  
        }  
    }  
   
    int find(char *s)  
    {  
        int u=0;  
        for(int i=0;s[i];++i)  
        {  
            int c=s[i]-'0';  
            if(!ch[u][c]) return -1;  
            u=ch[u][c];  
        }  
        return val[u];  
    }  
};

优点:访问速度非常快。

缺点:需要预先估计整个字典树的节点个数,否则会RE。同时需要非常大的内存空间,也容易MLE。和姿势2一样,不适合字符集非常大的字典树。


姿势2:动态指针形式

struct node{
    int sum;
    node* next[26];
    node(){
        sum = 0;
        memset(next,0,sizeof(next));
    }
};

struct Trie{
    static const int BASE = 'a';
    node * root;
    Trie(){root = new node;}
    ~Trie(){destroy(root);}

    void destroy(node * cur){
        for(int i =  0 ; i < 26; ++i)
            if(cur->next[i] != NULL)
                destroy(cur->next[i]);
        delete cur;
    }

    void insert(char * str){
        node* cur = root;
        for(char *p = str; *p; ++p){
            int c = *p - BASE;
            if(cur->next[c] == NULL)
                cur->next[c] = new node;
            cur = cur->next[c];
            cur->sum++;
        }
    }
    int query(char * str){
        node* cur = root;
        for(char *p = str; cur != NULL && *p != 0;++p)
            cur = cur->next[*p - BASE];
        if(cur == NULL)
            return 0;
        else
            return cur->sum;
    }
};

优点:动态申请空间,不用考虑字典树的节点的个数;

缺点:访问速度比第一种慢。因为要保存指针数组,不适合非常大的字符集。



姿势3:左儿子右兄弟形式

// 字母表为全体小写字母的Trie
struct Trie {
  int head[maxnode]; // head[i]为第i个结点的左儿子编号
  int next[maxnode]; // next[i]为第i个结点的右兄弟编号
  char ch[maxnode];  // ch[i]为第i个结点上的字符
  int tot[maxnode];  // tot[i]为第i个结点为根的子树包含的叶结点总数
  int sz; // 结点总数
  long long ans; // 答案
  void clear() { sz = 1; tot[0] = head[0] = next[0] = 0; } // 初始时只有一个根结点

  // 插入字符串s(包括最后的'\0'),沿途更新tot
  void insert(const char *s) {
    int u = 0, v, n = strlen(s);
    tot[0]++;
    for(int i = 0; i <= n; i++) {
      // 找字符a[i]
      bool found = false;
      for(v = head[u]; v != 0; v = next[v])
        if(ch[v] == s[i]) { // 找到了
          found = true;
          break;
        }
      if(!found) {
        v = sz++; // 新建结点
        tot[v] = 0;
        ch[v] = s[i];
        next[v] = head[u];
        head[u] = v; // 插入到链表的首部
        head[v] = 0;
      }
      u = v;
      tot[u]++;
    }
  }

  // 统计LCP=u的所有单词两两的比较次数之和
  void dfs(int depth, int u) {
    if(head[u] == 0) // 叶结点
      ans += tot[u] * (tot[u] - 1) * depth;
    else {
      int sum = 0;
      for(int v = head[u]; v != 0; v = next[v])
        sum += tot[v] * (tot[u] - tot[v]); // 子树v中选一个串,其他子树中再选一个
      ans += sum / 2 * (2 * depth + 1); // 除以2是每种选法统计了两次
      for(int v = head[u]; v != 0; v = next[v])
        dfs(depth+1, v);
    }
  }

  // 统计
  long long count() {
    ans = 0;
    dfs(0, 0);
    return ans;
  }
};
这个思路是将整个字典树用链表来存。对于每个节点,用head保存它所有儿子的链表的头,即左儿子。在利用这个头,去访问他的所有其他的儿子,即右兄弟。 


姿势4:map

struct Trie{
    map<char,Trie> next;
    map<char,int> times;


    void insert(char *s){
        if(*s == 0)
            return;
         else {
            times[*s]++;
            next[*s].insert(s+1);
        }
    }
    int find(char *s){
        if(next.count(*s) == 0)
            return 0;
        else if(s[1] == 0)
            return times[*s];
        else return next[*s].find(s+1);
    }
};

 优点:好写,在满足时间要求的情况下,代码量少。动态分配内存,不容易MLE

缺点:速度慢,找到每个元素会比数组多花费时间。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值