【ACWing】1285. 单词

题目地址:

https://www.acwing.com/problem/content/1287/

某人读论文,一篇论文是由许多单词组成的。但他发现一个单词会在论文中出现很多次,现在他想知道每个单词分别在论文中出现多少次。这里的论文可以理解为所有单词整体。

输入格式:
第一行一个整数 N N N,表示有多少个单词。接下来 N N N行每行一个单词,单词中只包含小写字母。

输出格式:
输出 N N N个整数,每个整数占一行,第 i i i行的数字表示第 i i i个单词在文章中出现了多少次。

数据范围:
1 ≤ N ≤ 200 1≤N≤200 1N200
所有单词长度的总和不超过 1 0 6 10^6 106

思路是AC自动机。可以这样想,对于每个串,我们把其所有的非空前缀都插到Trie里,那么问某个串 s s s出现的次数,其实就是问 s s s是Trie中多少个串的后缀。考虑将这个Trie建成AC自动机,那么每个节点 u u u n e [ u ] ne[u] ne[u]表示的是存在于Trie里的 u u u串的最长后缀(也就是说Trie里可能存储了好几个 u u u的后缀,存的最长的那个就是 n e [ u ] ne[u] ne[u]),那么所有以 s s s为后缀的串 u u u,一定满足 ∃ k , n e k [ u ] = s \exists k, ne^k[u]=s k,nek[u]=s,也就是说 u u u从其 n e ne ne指针跳若干次一定会跳到Trie中 s s s的终点。而由于 n e ne ne指针一定是从深度深的点向深度浅的点指的,所以整个Trie的节点连同其所有 n e ne ne指针(当然除了树根的)形成一个有向无环图(事实上整个Trie的节点连同其所有 n e ne ne的反向指针形成一棵树),所以其可以拓扑排序,只需要从深的节点向上递推就可以了。不需要特地拓扑排序,只需要将BFS的顺序反序遍历递推即可。设 f [ u ] f[u] f[u] u u u这个串的出现次数(这里的 u u u取遍Trie里插入的所有串,即原来所有串的所有前缀),则 f [ u ] f[u] f[u]其实就是沿着 n e ne ne指针,有多少个点可以走到它,那么可以按照最后一步来分类,有: f [ u ] = 1 + ∣ { v : n e k [ v ] = u , k ≥ 1 } ∣ = 1 + ∑ n e [ v ] = u f [ v ] f[u]=1+|\{v:ne^k[v]=u,k\ge 1\}|=1+\sum_{ne[v]=u} f[v] f[u]=1+{v:nek[v]=u,k1}=1+ne[v]=uf[v]代码如下:

#include <iostream>
using namespace std;

const int N = 1e6 + 10;
int n;
int tr[N][26], f[N], idx;
int q[N], ne[N];
char s[N];
// id[i]指的是第i个串对应的是哪个Trie节点
int id[210];

void insert(int k) {
  int p = 0;
  for (int i = 0; s[i]; i++) {
    int j = s[i] - 'a';
    if (!tr[p][j]) tr[p][j] = ++idx;
    p = tr[p][j];
    // 要把这个串的所有前缀都插入到Trie里
    f[p]++;
  }
  id[k] = p;
}

// 建AC自动机
void build() {
  int hh = 0, tt = 0;
  for (int i = 0; i < 26; i++)
    if (tr[0][i]) q[tt++] = tr[0][i];

  while (hh < tt) {
    int t = q[hh++];
    for (int i = 0; i < 26; i++) {
      int &p = tr[t][i];
      if (p) ne[p] = tr[ne[t]][i], q[tt++] = p;
      else p = tr[ne[t]][i];
    }
  }
}

int main() {
  scanf("%d", &n);
  for (int i = 0; i < n; i++) {
    scanf("%s", s);
    insert(i);
  }
  build();
  // 按ne指针的拓扑序递推,即按深度从深到浅递推,即按BFS逆序递推。
  // BFS只遍历了除树根的点,一共点数是idx + 1,队列的最后一个元素下标是idx - 1
  for (int i = idx - 1; i >= 0; i--) f[ne[q[i]]] += f[q[i]];
  for (int i = 0; i < n; i++) printf("%d\n", f[id[i]]);
}

时空复杂度 O ( n ) O(n) O(n) n n n是所有单词总长度之和。

题目链接:https://www.acwing.com/problem/content/4948/ 题目描述: 给定一棵有 $n$ 个结点的树,结点从 $1$ 到 $n$ 编号,每个结点都有一个权值 $w_i$,在有 $m$ 次操作,每次操作是将树编号为 $x$ 的结点的权值加上 $y$,然后询问一些节点是否为叶子节点,如果是输出 $1$,否则输出 $0$。 输入格式: 第一行包含两个整数 $n$ 和 $m$。 第二行包含 $n$ 个整数,其第 $i$ 个整数表示结点 $i$ 的初始权值 $w_i$。 接下来 $n-1$ 行,每行包含两个整数 $a$ 和 $b$,表示点 $a$ 和点 $b$ 之间有一条无向边。 接下来 $m$ 行,每行描述一次操作,格式为三个整数 $t,x,y$。其 $t$ 表示操作类型,$t=1$ 时表示将编号为 $x$ 的结点的权值加上 $y$,$t=2$ 时表示询问编号为 $x$ 的结点是否为叶子节点。 输出格式: 对于每个操作 $t=2$,输出一个结果,表示询问的结点是否为叶子节点。 数据范围: $1≤n,m≤10^5$, $1≤w_i,y≤10^9$ 样例: 输入: 5 5 1 2 3 4 5 1 2 1 3 3 4 3 5 2 3 0 1 3 100 2 3 0 1 1 100 2 3 0 输出: 1 0 0 算法1: 暴力dfs,每次都重新遍历整棵树,时间复杂度 $O(nm)$ 时间复杂度: 最坏情况下,每次操作都要遍历整棵树,时间复杂度 $O(nm)$,无法通过此题。 算法2: 用一个 vector<int> sons[n+5] 来存储每个点的所有子节点,这样可以用 $O(n)$ 预处理出每个点的度数 $deg_i$,如果 $deg_i=0$,则 $i$ 是叶子节点,否则不是。 对于每个操作,只需要更新叶子节点关系的变化就可以了。如果某个节点的度数从 $1$ 变成 $0$,则该节点变成了叶子节点;如果某个节点的度数从 $0$ 变成 $1$,则该节点不再是叶子节点。 时间复杂度: 每次操作的时间复杂度是 $O(1)$,总时间复杂度 $O(m)$,可以通过此题。 C++ 代码: (算法2)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值