背景:
压缩是一种有效的减小数据量的方法,目前已经被广泛应用于各种类型的信息系统之中。
一种压缩文本文件(假设文件中不包含数字)的方法如下:
1. 原始文本文件中的非字母的字符,直接拷贝到压缩文件中;
2. 原始文件中的词(全部由字母组成),如果是第一次出现,则将该词加入到一个词的列表中,并拷贝到压缩文件中;否则该词不拷贝到压缩文件中,而是将该词在词的列表中的位置拷贝到压缩文件中。
3. 词的列表的起始位置为 1 。 词的定义为文本中由大小写字母组成的最大序列。大写字母和小写字母认为是不同的字母,即 abc 和 Abc 是不同的词。词的例子如下: x-ray 包括两个词 x 和 ray;mary's 包括两个词 mary 和 s;a c-Dec 包括三个词 a 和 c 和 Dec 编写一个程序,输入为一组字符串,输出为压缩后的文本。
输入:
输入为一段文本,可以假设输入中不会出现数字、每行的长度不会超过 80 个字符,并且输入文本的大小不会超过 10M。
输出:
压缩后的文本。
测试输入 | 期待的输出 | 时间限制 | 内存限制 | 额外进程 | |
---|---|---|---|---|---|
测试用例 1 | 以文本方式显示
| 以文本方式显示
| 1秒 | 1024KB | 0 |
#include <stdio.h>
#include <string.h>
int main() {
char a[101] = {}, b[10086][30] = {}, c[108] = {};
int i, j, m = 0, n = 0, flag = 1;
while (gets(a)) {
if (a[0] == '\0') {
printf("\n");
continue;
}
for (i = 0; a[i] != '\0'; i++)
c[i + 1] = a[i];
c[0] = ' ', c[i + 1] = '\0', i = 1, n = 0;
while (c[i] != '\0') {
if (((c[i] >= 'a' && c[i] <= 'z') || (c[i] >= 'A' && c[i] <= 'Z')) && !((c[i - 1] >= 'a' && c[i - 1] <= 'z')
|| (c[i - 1] >= 'A' && c[i - 1] <= 'Z')))
m++;//遇见单词首字母换行
if ((c[i] >= 'a' && c[i] <= 'z') || (c[i] >= 'A' && c[i] <= 'Z')) {
b[m][n++] = c[i];
if (!((c[i + 1] >= 'a' && c[i + 1] <= 'z') || (c[i + 1] >= 'A' && c[i + 1] <= 'Z'))) { //单词尾字母
b[m][n] = '\0', flag = 1;
for (j = 0; j < m; j++) {
if (!strcmp(b[j], b[m])) {
printf("%d", j);
m--, flag = 0;
break;
}
}
if (flag)
printf("%s", b[m]);
}
} else {
printf("%c", c[i]);
n = 0;
}
i++;
}
printf("\n");
}
return 0;
}