文本压缩有很多种方法,这里我们只考虑最简单的一种:把由相同字符组成的一个连续的片段用这个字符和片段中含有这个字符的个数来表示。例如 ccccc
就用 5c
来表示。如果字符没有重复,就原样输出。例如 aba
压缩后仍然是 aba
。
解压方法就是反过来,把形如 5c
这样的表示恢复为 ccccc
。
本题需要你根据压缩或解压的要求,对给定字符串进行处理。这里我们简单地假设原始字符串是完全由英文字母和空格组成的非空字符串。
输入格式:
输入第一行给出一个字符,如果是 C 就表示下面的字符串需要被压缩;如果是 D 就表示下面的字符串需要被解压。第二行给出需要被压缩或解压的不超过 1000 个字符的字符串,以回车结尾。题目保证字符重复个数在整型范围内,且输出文件不超过 1MB。
输出格式:
根据要求压缩或解压字符串,并在一行中输出结果。
输入样例 1:
C
TTTTThhiiiis isssss a tesssst CAaaa as
输出样例 1:
5T2h4is i5s a3 te4st CA3a as
输入样例 2:
D
5T2h4is i5s a3 te4st CA3a as10Z
输出样例 2:
TTTTThhiiiis isssss a tesssst CAaaa asZZZZZZZZZZ
- 思路:双指针法
pack(): 截取出重复片段[i, j)
unpack(): 注意数字可能不止一位,需求出实际数值
- code:
#include <bits/stdc++.h>
#include <string>
using namespace std;
void pack(string s){
int i = 0, j = 1;
while(j <= s.size()){
while(s[j] == s[i]) j++;
if(j == i + 1) printf("%c", s[i]);
else printf("%d%c", j-i, s[i]);
i = j;
j = i + 1;
}
}
bool isNum(char c){
if('0' <= c && c <= '9') return true;
return false;
}
void unpack(string s){
int i = 0, j = 0;
while(j < s.size()){
while(isNum(s[j])) j++;
int cnt = 0;
if(j > i){
for(int k = i; k < j; ++k){
cnt = cnt * 10 + s[k] - '0';
}
}
if(j == i) printf("%c", s[j]);
for(int k = 0; k < cnt; ++k) printf("%c", s[j]);
i = ++j;
}
}
int main(){
char op;
string s;
cin >> op;
getchar();
getline(cin, s);
if(op == 'C') pack(s);
else unpack(s);
return 0;
}
- 求重复子串部分改进:
void pack(string s){
int i = 0, j = 0;
while(j < s.size()){
while(j < s.size() && s[j] == s[i]) j++;
if(j == i + 1) printf("%c", s[i]);
else printf("%d%c", j-i, s[i]);
i = j;
}
}