文本压缩有很多种方法,这里我们只考虑最简单的一种:把由相同字符组成的一个连续的片段用这个字符和片段中含有这个字符的个数来表示。例如 ccccc
就用 5c
来表示。如果字符没有重复,就原样输出。例如 aba
压缩后仍然是 aba
。
解压方法就是反过来,把形如 5c
这样的表示恢复为 ccccc
。
本题需要你根据压缩或解压的要求,对给定字符串进行处理。这里我们简单地假设原始字符串是完全由英文字母和空格组成的非空字符串。
输入格式:
输入第一行给出一个字符,如果是 C
就表示下面的字符串需要被压缩;如果是 D
就表示下面的字符串需要被解压。第二行给出需要被压缩或解压的不超过 1000 个字符的字符串,以回车结尾。题目保证字符重复个数在整型范围内,且输出文件不超过 1MB。
输出格式:
根据要求压缩或解压字符串,并在一行中输出结果。
输入样例 1:
C
TTTTThhiiiis isssss a tesssst CAaaa as
输出样例 1:
5T2h4is i5s a3 te4st CA3a as
输入样例 2:
D
5T2h4is i5s a3 te4st CA3a as10Z
输出样例 2:
TTTTThhiiiis isssss a tesssst CAaaa asZZZZZZZZZZ
总结:
在字符串中判断 数字字符 和 非数字字符,并进行相关的压缩和解压操作。在其中注意相关数字类型的转化,对 >10 的数字字符该如何处理。
代码:
#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
using namespace std;
int main()
{
char shape;
scanf("%c",&shape);
getchar(); // 消除回车
string textStr, resultStr;
getline(cin, textStr);
// 进行压缩操作
if( shape=='C' ) {
for(int i=0;i<textStr.length();) {
// 定义 字符坐标
int sameIndex = i;
// 利用循环,判断下一个不同字符的坐标,并且在这进行 i 的自加操作
while( textStr[++i] == textStr[sameIndex] && i<textStr.length() );
//===================================================================================
// 如果两坐标的相差大于 1 的时候,将其坐标差压缩,其利用 to_string() 函数转换
// 若用 i-sameIndex + '0',则无法正确加入 > 十位数
//===================================================================================
if( i-sameIndex > 1 )
resultStr += to_string(i-sameIndex);
// 加入结果字符
resultStr += textStr[sameIndex];
}
}
// 进行解压操作
else {
// 定义数字
int num = 0;
for(int i=0;i<textStr.length();i++) {
// 如果当前字符为 数字字符 的时候
if(textStr[i]>='0' && textStr[i]<='9') {
// 循环判断,下一位的字符是否为 数字字符,如果是 数字字符,让前一位 *10 ,然后再加上该位
while( textStr[i]>='0' && textStr[i]<='9' ) {
num = num * 10 + textStr[i]-'0';
i++;
}
// 循环累加结果值
for(;num>0;num--) {
resultStr += textStr[i];
}
}
// 当不是 数字字符 的时候,直接进行加入运算
else {
resultStr += textStr[i];
}
}
}
cout << resultStr << endl;
return 0;
}