题目链接
题目大意是给一个单词序列,里面如果出现重复的单词组(两个及以上连续单词),就可以将单词组里面的单词用一个字母替换,总长度就会减小。每次只有一个重复出现的单词组可以替换,求总长度的最小值。例如“to be or nor to be”就可以替换成"TB or not TB",总长度就由18变为12。
我一开始想的是用“.”替换空格,然后在新的字符串中找最长重复子串。上网搜了一下可以用后缀数组求,也可以二分最长重复子串的长度。
但是写着写着发现不可行,这样有可能最后得到的子串不是完整的单词。
看了一篇题解,上面给的解法是给单词编码后暴力枚举子串(因为总共不到300个单词),用kmp求出子串在原串里面出现的次数,然后计算替换后的长度,取最小值。这样的话复杂度是n^3,对于300的数据范围来说完全可以。
我一开始以为对单词编码需要用26进制转10进制,但是字符串总长度是10^5,这样编码long long都不够存,后来一看用map就可以,相当简单的编码hhh
map要注意key和value的顺序,key在前,是不可重复的,寻找的依据。这里用string作为key。
#include <cstdio>
#include <iostream>
#include <cstring>
#include <map>
#include <string>
#include <algorithm>
#include <climits>
using namespace std;
int len[305];
map<string, int> m;
int a[305], b[305], nextval[305];
int cnt = 0;
int n;
void getnext(int *b, int *nextval, int size)
{
int i = 0, j = -1;
nextval[0] = -1;
while (i < size)
{
if (j == -1 || b[i] == b[j])
{
i++, j++;
if (b[i] == b[j])
{
nextval[i] = nextval[j];
}
else
{
nextval[i] = j;
}
}
else
{
j = nextval[j];
}
}
}
int counttimes(int *a, int *b, int *nextval, int size)
{
int t = 0;
// for (int i = 0; i < size; i++)
// {
// printf("%d ", nextval[i]);
// }
// printf("n = %d, size = %d\n", n, size);
int i = 0, j = 0;
while (i < n)
{
if (j == -1 || a[i] == b[j])
{
i++, j++;
if (j == size)
{
t++;
j = 0;
}
}
else
{
j = nextval[j];
}
}
return t;
}
int main()
{
scanf("%d", &n);
for (int i = 0; i < n; i++)
{
string s;
cin >> s;
if (!m.count(s))
{
m[s] = cnt;
a[i] = cnt;
cnt++;
}
else
{
a[i] = m[s];
}
len[i] = s.size();
}
// for (int i = 0; i < n; i++)
// {
// printf("%d ", a[i]);
// }
// printf("\n");
int totallen = 0;
for (int i = 0; i < n; i++)
{
totallen += len[i] + 1;
}
totallen -= 1;
if (cnt == n)
{
printf("%d\n", totallen);
return 0;
}
int ans = totallen;
for (int l = 0; l < n; l++)
{
for (int r = l; r < n; r++)
{
int size = r - l + 1;
int partlen = 0;
for (int i = l; i <= r; i++)
{
b[i - l] = a[i];
partlen += len[i] + 1;
}
partlen -= 1;
getnext(b, nextval, size);
int t = counttimes(a, b, nextval, size);
if (t > 1)
{
//printf("%d\n", t);
ans = min(ans, totallen - partlen * t + (size) * t);
//printf("ans = %d\n", ans);
}
}
}
printf("%d\n", ans);
return 0;
}
我写getnext的时候犯沙茶错误了QAQ,写了个b[i] == b[i]
愣是半天没看出来TVT 以后一定在写的时候要好好注意,不然的话超级浪费时间。