"strcmp()" Anyone?
比较两个字符串的大小用strcmp()函数,对于这个函数而言,比较两个字符串如“than”和“that”需要7次因为
(s[i]==t[i]和s[i]=='\0'各算一次)
题目要求:给你一堆字符串(数字加字母大小写),求两两调用一次strcmp总的比较次数是多少?
样例输入
2
a
b
4
cat
hat
mat
sir
0
样例输出
解题思路:
这题对于一个暴力的人来说,乍一看来,很简单,其实不然,这题要是两两比较肯定会超时
那么怎么办?
首先比较是从前往后比较的,那么很容易就想到前缀树,那么前缀树要怎么实现呢?用矩阵?
仔细一算,不行,矩阵的话开不了那么大的数组ch[maxnode][sigma_size]maxnode=4000*1000,sigma = 26+26+10
那么这个树就不能用这种方法实现,
那么树还有一种表示法叫做“兄弟儿子”表示法
这题就思路明显了
用这种方法建树,然后搜索,从根往下搜索,
每到一个有兄弟的节点就意味着有了不同的字符串,那么计算一下比较次数
每到一个叶子节点就意味着完全相同字符串的比较结束,那么计算一下比较次数
最后注意一下计算过程即可。
这种代码可以当作模板来用
(s[i]==t[i]和s[i]=='\0'各算一次)
题目要求:给你一堆字符串(数字加字母大小写),求两两调用一次strcmp总的比较次数是多少?
样例输入
2
a
b
4
cat
hat
mat
sir
0
样例输出
Case 1: 1
Case 2: 6
解题思路:
这题对于一个暴力的人来说,乍一看来,很简单,其实不然,这题要是两两比较肯定会超时
那么怎么办?
首先比较是从前往后比较的,那么很容易就想到前缀树,那么前缀树要怎么实现呢?用矩阵?
仔细一算,不行,矩阵的话开不了那么大的数组ch[maxnode][sigma_size]maxnode=4000*1000,sigma = 26+26+10
那么这个树就不能用这种方法实现,
那么树还有一种表示法叫做“兄弟儿子”表示法
这题就思路明显了
用这种方法建树,然后搜索,从根往下搜索,
每到一个有兄弟的节点就意味着有了不同的字符串,那么计算一下比较次数
每到一个叶子节点就意味着完全相同字符串的比较结束,那么计算一下比较次数
最后注意一下计算过程即可。
#include<cstring>
#include<vector>
using namespace std;
const int maxnode = 4000 * 1000 + 10;
// 字母表为全体小写字母的Trie
struct Trie {
int head[maxnode]; // head[i]为第i个结点的左儿子编号
int next[maxnode]; // next[i]为第i个结点的右兄弟编号
char ch[maxnode]; // ch[i]为第i个结点上的字符
int tot[maxnode]; // tot[i]为第i个结点为根的子树包含的叶结点总数
int sz; // 结点总数
long long ans; // 答案
void clear() { sz = 1; tot[0] = head[0] = next[0] = 0; } // 初始时只有一个根结点
// 插入字符串s(包括最后的'\0'),沿途更新tot
void insert(const char *s) {
int u = 0, v, n = strlen(s);
tot[0]++;
for(int i = 0; i <= n; i++) {
// 找字符a[i]
bool found = false;
for(v = head[u]; v != 0; v = next[v]){
if(ch[v] == s[i]) { // 找到了
found = true;
break;
}
}
if(!found) {
v = sz++; // 新建结点
tot[v] = 0;
ch[v] = s[i];
next[v] = head[u];
head[u] = v; // 插入到链表的首部
head[v] = 0;
}
u = v;
tot[u]++;
}
}
// 统计LCP=u的所有单词两两的比较次数之和(LCP:最长公共前缀)
void dfs(int depth, int u) {
if(head[u] == 0) {// 叶结点
ans += tot[u] * (tot[u] - 1) * depth;
}
else {
int sum = 0;
for(int v = head[u]; v != 0; v = next[v]){
sum += tot[v] * (tot[u] - tot[v]); // 子树v中选一个串,其他子树中再选一个
}
ans += sum / 2 * (2 * depth + 1); // 除以2是每种选法统计了两次
for(int v = head[u]; v != 0; v = next[v]){
dfs(depth+1, v);
}
}
}
// 统计
long long count() {
ans = 0;
dfs(0, 0);
return ans;
}
};
#include<cstdio>
const int maxl = 1000 + 10; // 每个单词最大长度
int n;
char word[maxl];
Trie trie;
int main() {
int kase = 1;
while(scanf("%d", &n) == 1 && n) {
trie.clear();
for(int i = 0; i < n; i++) {
scanf("%s", word);
trie.insert(word);
}
printf("Case %d: %lld\n", kase++, trie.count());
}
return 0;
}
这种代码可以当作模板来用