【字符】压缩文本文件

最新推荐文章于 2024-05-03 10:14:52 发布

mwt20201010

最新推荐文章于 2024-05-03 10:14:52 发布

阅读量358

点赞数 1

文章标签：算法 c语言

本文链接：https://blog.csdn.net/m0_74284464/article/details/127943581

版权

背景：

压缩是一种有效的减小数据量的方法，目前已经被广泛应用于各种类型的信息系统之中。

一种压缩文本文件（假设文件中不包含数字）的方法如下：

1. 原始文本文件中的非字母的字符，直接拷贝到压缩文件中；

2. 原始文件中的词（全部由字母组成），如果是第一次出现，则将该词加入到一个词的列表中，并拷贝到压缩文件中；否则该词不拷贝到压缩文件中，而是将该词在词的列表中的位置拷贝到压缩文件中。

3. 词的列表的起始位置为 1 。词的定义为文本中由大小写字母组成的最大序列。大写字母和小写字母认为是不同的字母，即 abc 和 Abc 是不同的词。词的例子如下： x-ray 包括两个词 x 和 ray；mary's 包括两个词 mary 和 s；a c-Dec 包括三个词 a 和 c 和 Dec 编写一个程序，输入为一组字符串，输出为压缩后的文本。

输入：

输入为一段文本，可以假设输入中不会出现数字、每行的长度不会超过 80 个字符，并且输入文本的大小不会超过 10M。

输出：

压缩后的文本。

	测试输入	期待的输出	时间限制	内存限制	额外进程
测试用例 1	以文本方式显示 Please, please do it--it would please Mary very,↵ very much.↵ ↵ Thanks↵	以文本方式显示 Please, please do it--4 would 2 Mary very,↵ 7 much.↵ ↵ Thanks↵	1秒	1024KB	0

#include <stdio.h>
#include <string.h>

int main() {
	char a[101] = {}, b[10086][30] = {}, c[108] = {};
	int i, j, m = 0, n = 0, flag = 1;
	while (gets(a)) {
		if (a[0] == '\0') {
			printf("\n");
			continue;
		}
		for (i = 0; a[i] != '\0'; i++)
			c[i + 1] = a[i];
		c[0] = ' ', c[i + 1] = '\0', i = 1, n = 0;
		while (c[i] != '\0') {
			if (((c[i] >= 'a' && c[i] <= 'z') || (c[i] >= 'A' && c[i] <= 'Z')) && !((c[i - 1] >= 'a' && c[i - 1] <= 'z')
			        || (c[i - 1] >= 'A' && c[i - 1] <= 'Z')))
				m++;//遇见单词首字母换行
			if ((c[i] >= 'a' && c[i] <= 'z') || (c[i] >= 'A' && c[i] <= 'Z')) {
				b[m][n++] = c[i];
				if (!((c[i + 1] >= 'a' && c[i + 1] <= 'z') || (c[i + 1] >= 'A' && c[i + 1] <= 'Z'))) { //单词尾字母
					b[m][n] = '\0', flag = 1;
					for (j = 0; j < m; j++) {
						if (!strcmp(b[j], b[m])) {
							printf("%d", j);
							m--, flag = 0;
							break;
						}
					}
					if (flag)
						printf("%s", b[m]);
				}
			} else {
				printf("%c", c[i]);
				n = 0;
			}
			i++;
		}
		printf("\n");
	}
	return 0;
}