文章目录
题解
题目:
题目意思就是让你找到每个输入的字符串的某个前缀字符串作为本身的唯一标识,这些前缀字符串需要满足相互之间都不为前缀的条件.(比如aaaaa 和abababab,这两个字符串的前缀都不能单独取a,因为a是它们的公共前缀,所以想要通过前缀区分它们两个就要从公共前缀开始取到第一个彼此不相同的字符,也就是aa和ab),然后统计这些前缀字符串的字符总数.
在此提出一个问题,样例输入中如果还有一个字符为abcd呢?
显然abababab的前缀名就不能叫ab了,因为受ab为abcd和abababab公共前缀的影响,abababab的前缀名要改为aba,abcd的前缀名为abc.所以决定某个字符串的前缀名时,要考虑和它存在公共前缀的所有字符串可能带来的影响.
aaaaa 前缀名:aa
bbb 前缀名:b
abababab 前缀名:aba
abcd 前缀名:abc
解决办法:有这么一种数据结构叫字典树,常被用于统计和排序大量的字符串,在这种数据结构中字符串之间的公共前缀会被合并在一起,这道题就是利用该特点来统计所有前缀字符串的字符总数.
那么怎么根据这种数据结构来统计符合条件的所有前缀字符串字符总和呢?
我们在每个节点加入一个属性值count表示该节点的使用次数。
例如:第一层 a节点的count为 2表示a作为字符串的第一个字母被使用2次,也就是有两个字符串共用了这个字符(aaaaa和abababab)
以sum记录前缀字符串字符数目
从head指向的第一层(a-z)开始遍历每个节点(也就是每个字符串的开头)如果遇到count值不为0的节点(补充一个点:图中没写数字的节点count值就为0,表示这个字符未被使用过)判断该节点的count值为1还是大于1,如果为1表示该字母是不和其他字符串共用的,因此可以用它组成一个用于区分其他字符串的前缀名字符串.
例如:第一层的b的count=1,表示字母b只被一个字符串作为第一个字母,不存在共用,所以字母b被作为bbb的前缀名字符串,所以此时sum的值加1,sum=1.
对于count值为n且n大于1的节点x(存在共用的节点),代表着该节点x被使用过n次,可以从该节点(最多)分支出n个字符串(这个节点被这n个字符串共用了),此时sum的值就要加n,因为这n个字符串的前缀名都必需要用这个字母一次.然后从该节点往下遍历下一层节点,如果又遇到一个节点count值为2的那么sum加2,理由同上文一致。继续往下遍历,直到出现分支也就是出现一个count为1的节点,就可以确定一个字符串的前缀名即结束一条往下的路线,此时sum+1.
例如:第一层的a的count=2,代表有两条字符串共用这个字母作为前缀,所以sum+2=3,遍历从该节点往下一层伸出的分支,遇到count值为1的节点a,则遇到了没被共用的字母,也就是在此时可以确定一个字符串的前缀名了,即确定字符串(aaaaa)的前缀名为aa,所以sum+1=4且节点a不会再往下遍历了,然后向右遍历遇到节点b,count值为1,即可确定另一个字符串(abababab)的前缀名为ab,sum的值加1为5,三个字符串的前缀名字母数量统计结束.(代码实现其实是最后统计bbb的前缀名字符数)
#include <stdio.h>
#include <iostream>
#include <cstring>
using namespace std;
//可以结合图片理解
typedef struct Node{
int count=0;
struct Node* next[26]={NULL}; //这里必需初始化为空 因为用的是new 来开辟空间!!!
}node,*T;
void insert(T h,char a[])
{
T p=h; //用P存放头指针
int length=strlen(a); //量取字符串的长度
//index值的范围为0-25 p->next[0]~p->next[25]代表 a-z共计26个字母
for(int i=0;i<length;i++) //遍历字符串每个字符
{
int index=a[i]-'a'; //将字符换算为下标 0-25~a-z
if(p->next[index]==NULL) //如果满足该条件说明该字母将被当前字符串使用一次还是第一次使用
{
T temp=new node; //创建新的节点 new node 不等价于 (tree)calloc(1,sizeof(node))! 后者可开辟一个节点的空间且自动初始化该内存空间所有值为零!!!
temp->count=1; //节点count值为1代表被一个字符串使用
p->next[index]=temp; //链接节点
p=temp; //***下移***指针 (结合图片理解)
}
else //否则当前字母被共用
{
p=p->next[index]; //无需创建新节点直接下移指针
p->count+=1; //该节点count++ 表示共用该字母的字符串个数加1
}
}
}
int find(T h)
{
int sum=0; //sum初始值为0
for(int i=0;i<26;i++) //0-26~a-z
{
if(h->next[i]!=NULL) //指针不为NULL 代表该字母有被使用
{
sum+=h->next[i]->count; //统计使用次数
if(h->next[i]->count>1) //大于1表示存在多个字符串共用该字母的情况,需要寻找非共用字母来确定前缀名
{
sum+=find(h->next[i]); //利用递归向下寻找非共用字母
}
}
}
return sum; //返回sum作为答案或者为递归返回值
}
char a[1000000]; //输入可能为:1 //一组数据
// 1 //1个字符串
// aa....a //所以可能只有一个字符串且长度最大为999999
int main()
{
int n,m; //n为数据组数 m为每组数据的字符串数
scanf("%d",&n);
while(n--)
{
scanf("%d",&m);
T h=new node; //为了給每组数据建立一个字典树,每次while循环需要重新开一个头指针.
while(m--)
{
scanf("%s",a);
insert(h,a); //向字典树插入输入的字符串
}
printf("%d\n",find(h));
}
return 0;
}
借鉴:大佬博客