字符串压缩

隐约记得这道笔试题,之前在网上看到过一次,感觉应该能做出来,结果第一次尝试折腾了半天,弄有bug统计kkll这样的可以但是字符出现连续三次以上的这就不行了,第二天理了一次,用笔画了画,2分钟搞定了。总结:写程序必须先理清楚思路,再动手敲,不然。。。

为了发出来又百度了原题,原题要求用以各函数实现,第一次没有意识到,只在意结果,就没想着用函数,既然又要求,下次再补上。

原题是这样的:

通过键盘输入一串小写字母(a~z)组成的字符串。请编写一个字符串压缩程序,将字符串中连续出席的重复字母进行压缩,并输出压缩后的字符串。 压缩规则:

1. 仅压缩连续重复出现的字符。比如字符串"abcbc"由于无连续重复字符,压缩后的字符串还是"abcbc".
2. 压缩字段的格式为"字符重复的次数+字符"。例如:字符串"xxxyyyyyyz"压缩后就成为"3x6yz" 
要求实现函数: 
void stringZip(const char *pInputStr, long lInputLen, char *pOutputStr); 
【输入】 pInputStr:  输入字符串
         lInputLen:  输入字符串长度         
【输出】 pOutputStr: 输出字符串,空间已经开辟好,与输入字符串等长; 
【注意】只需要完成该函数功能算法,中间不需要有任何IO的输入输出 
示例 

输入:“cccddecc”   输出:“3c2de2c” 输入:“adef”     输出:“adef” 输入:“pppppppp” 输出:“8p。

这里是用循环做的,还不够完善,无法统计十五以上的次数,所以用加号(+)暂时代替。

#include<stdio.h>

int main(void){

	char str[1024] = {0};
	char *pwr = &str[0];
	char *p, *mark;
	int count = 1;
		printf("please input a string:\nbefore:");
		scanf("%s", str);
	for(p=&str[0];*p != '\0';p++){
	
		if(*p != *(p+1)){

			if(count > 1){
				pwr++;
				count = 1;
			}
			*pwr = *p;
			pwr++;
		}else{
			if(count == 1)mark = pwr;
			count++;
			*mark = count+48;
			if(*mark > 57)*mark = *mark+7;
			if(*mark > 70)*mark = '+';
		}
	
	}
	*pwr = '\0';
	
	printf("after:%s\n", str);
	return 0;
}

改写成题中函数接口的:

#include<stdio.h>
#include<string.h>
#include<stdlib.h>

void stringZip(const char *pinputStr, long inputLen, char* pOutputStr){

	char *mark;
	char *p = pinputStr;
	int count = 1;
	int i;

	for(i=0;i<inputLen;i++, p++){
	
		if(*p != *(p+1)){

			if(count > 1){
				pOutputStr++;
				count = 1;
			}
			*pOutputStr = *p;
			pOutputStr++;
		}else{
			if(count == 1)mark = pOutputStr;
			count++;
			*mark = count+48;
			if(*mark > 57)*mark = *mark+7;
			if(*mark > 70)*mark = '+';
		}
	
	}
	*pOutputStr = '\0';
}


int main(void){

	char istr[1024];
        memset(istr,0,sizeof(istr));
        printf("please input a string:\n");
	scanf("%s", istr);
	const char* istr_temp = istr;
	char *ostr = (char*)malloc(strlen(istr));
	memset(ostr, 0, strlen(istr));

	stringZip(istr_temp, (long)strlen(istr), ostr);

	printf("after zip:%s\n", ostr);
	free(ostr);
	return 0;
}

const 保护istr_temp常量指针不被修改,编译时候第八行会报警告[initialization discards ‘const’ qualifier from pointer target type],到这里终于读懂原题的意思了,它说别用指针操作,用下标吧。不然给的inputlen参数是为什么?我好迟钝..再改为下标操作的:

void stringZip(const char *pinputStr, long inputLen, char* pOutputStr){

	char *mark;//记录重复字符出现的起始位置
	int count = 1;//字符的重复次数,默认为1
	int i;

	for(i=0;i<inputLen;i++){
	
		if(pinputStr[i] != pinputStr[i+1]){

			if(count > 1){
				pOutputStr++;
				count = 1;
			}
			*pOutputStr = pinputStr[i];
			pOutputStr++;
		}else{
			if(count == 1)mark = pOutputStr;
			count++;
			*mark = count+48;
			if(*mark > 57)*mark = *mark+7;
			if(*mark > 70)*mark = '+';
		}
	
	}
	*pOutputStr = '\0';
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 可以使用Python的gzip库来进行字符串压缩。下面是一个简单的例子: ```python import gzip string = "This is a test string to be compressed." compressed_data = gzip.compress(bytes(string, 'utf-8')) ``` 在上面的例子中,首先将原始字符串换为字节串,然后使用gzip.compress()函数进行压缩压缩后的数据将存储在compressed_data变量中。 要解压缩数据,可以使用gzip.decompress()函数,如下所示: ```python decompressed_data = gzip.decompress(compressed_data) print(decompressed_data.decode('utf-8')) ``` 在上面的例子中,使用gzip.decompress()函数将压缩后的数据解压缩,并使用decode()函数将结果换为字符串。 ### 回答2: Python中的字符串压缩是指将一个字符串连续重复的字符进行压缩,以减少字符串的长度。例如,字符串"AAABBBCCC"可以压缩为"3A3B3C"。 实现字符串压缩的方法是使用两个指针,一个指针用来记录当前重复字符的起始位置,另一个指针用来遍历整个字符串。通过比较两个指针指向的字符,如果相同则将第二个指针向后移动一位,直到找到不同的字符,此时将重复字符的个数和字符本身拼接起来,并更新第一个指针为当前字符。重复上述步骤直到遍历完整个字符串。 下面是一个示例代码实现: ```python def compress_string(s): if not s: return s compressed = "" count = 1 pointer = 0 for i in range(1, len(s)): if s[i] == s[pointer]: count += 1 else: compressed += str(count) + s[pointer] count = 1 pointer = i compressed += str(count) + s[pointer] if len(compressed) >= len(s): return s else: return compressed # 测试 s = "AAABBBCCC" compressed = compress_string(s) print(compressed) # 输出:"3A3B3C" ``` 需要注意的是,压缩后的字符串长度应小于原始字符串才能进行压缩,否则直接返回原始字符串。在上述代码中,我们使用了一个`compressed`变量来存储压缩后的字符串,`count`用于记录重复字符的个数,`pointer`指向当前重复字符的起始位置。最后,利用`len()`函数比较压缩前后字符串的长度,选取合适的返回值。 希望以上回答对您有所帮助! ### 回答3: Python字符串压缩是指对字符串进行压缩,以减小字符串的存储空间或传输带宽的占用。在Python中,常用的字符串压缩方法包括压缩算法和压缩模块。 1. 压缩算法: - Run Length Encoding (RLE):这是最简单的压缩算法之一,它通过将连续相同字符替换为一个字符和出现次数的计数来压缩字符串。例如,字符串"AAAABBBCCCCCC"可以被压缩为"A4B3C6"。 - Huffman压缩:它通过根据字符频率构建一个最优二叉树来压缩字符串,出现频率高的字符使用较短的编码,出现频率低的字符使用较长的编码。 2. 压缩模块: - gzip模块:这是Python的内置模块,用于压缩和解压缩文件和数据流。使用gzip模块,可以将字符串压缩为gzip格式的文件,或者将gzip格式的文件解压缩字符串。 - zlib模块:这也是Python的内置模块,提供了对数据和字符串进行压缩和解压缩的功能。使用zlib模块,可以将字符串压缩为zlib格式的数据,或者将zlib格式的数据解压缩字符串。 在实际应用中,我们可以根据具体的需求选择合适的压缩方法。例如,如果字符串中存在连续重复的字符较多,可以选择RLE算法进行压缩;如果需要将字符串存储为文件或通过网络传输,可以选择gzip或zlib模块进行压缩压缩后的字符串可以通过相应的解压缩方法进行恢复原始字符串。总之,Python提供了丰富的字符串压缩方法,可以根据具体情况选择最合适的方法进行压缩和解压缩操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值