13. 压缩文本

本文介绍了一种文本压缩方法,通过保留非字母字符并记录首次出现的词来减少数据量。程序设计要求包括处理输入文本,识别词并创建压缩文件,其中词列表起始于位置1。压缩目标是减小文本大小,适用于信息系统。
摘要由CSDN通过智能技术生成

压缩是一种有效的减小数据量的方法,目前已经被广泛应用于各种类型的信息系统之中。一种压缩文本的方法如下:

  1. 原始文本文件中的非字母的字符,直接拷贝到压缩文件中;
  2. 原始文件中的词(全部由字母组成),如果是第一次出现,则将该词加入到一个词的列表中,并拷贝到压缩文件中;否则该词不拷贝到压缩文件中,而是将该词在词的列表中的位置拷贝到压缩文件中;
  3. 词的列表的起始位置为 1。

词的定义为文本中由大小写字母组成的最大序列。(单词不跨行)大写字母和小写字母认为是不同的字母,即 abc 和 Abc 是不同的词。例子如下:

  • x-ray 包括两个词 x 和 ray
  • mary's 包括两个词 mary 和 s
  • a c-Dec 包括三个词 a 和 c 和 Dec

请编写一个程序,实现文本的压缩。

输入

输入为一段文本,你可以假设输入中不会出现数字、每行的长度不会超过 80 个字符,并且输入文本的大小不超过 10M。

输出

输出压缩后的文本。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值