【字符串转置】 字符串包含长度不等的字符

【字符串转置】 

字符串包含长度不等的字符,eg "ab张三cde李f四21王二gh"

【背景知识】

ASCII码字符值都小于0x80 而汉字的两个字符一般都是0x80以上第一个字节是必需为0x80以上,第二个字符未扩展之前GBK码都是0x80以上,扩展后,一些自定义字,完全无视ASCII码规则了,第二个字节可能是个字母,这样的情况多见于生辟字,自造字

标准的国标码中汉字的首字节和次字节都在区位码范围内,双字节符号至少也是首字节大于0x80

即使是生辟字,至少也尊守了首字节大于0x80,如果用有符号数来检查,则首字是个负数


下面提供两种方法:

(1)分别是开辟新数组复制

(2)原地双重转置


注意点:

char型的范围为-128~127,所以带汉字的字符串需要unsigned char 数组存储;

汉字占用两个字节(字符),且高低字节顺序不能转置;


#include<stdio.h>
#include<iostream>
#include<string>
using namespace std;
int main(){
	
	unsigned char str[20];
	int i=0,len=0;	
	scanf("%s",str);	
	while( str[len]!='\0')
		len++;
	printf("%d\n%s\n",len,str);

	unsigned char *res=new 	unsigned char[len];
	//法1:开辟等长字符数组
	while(str[i]!='\0')
	{
		if(str[i]<0x80)			//非汉字判断
		{
		res[len-i-1]=str[i];
		i++;
		}
		else
		{
		res[len-i-2]=str[i];
		res[len-i-1]=str[i+1];
		i+=2;
		}
	}
	res[len]='\0';
	printf("%s\n",res);

	//法2:原地交换
	unsigned char temp;		 
 
	for(i=0;i<len/2;i++)			    //全部转置 
		swap(str[i],str[len-1-i]);

	for(i=len-1;i>0;i--)				//汉字修正
	{
		if(str[i]>0x80)
		{
		swap(str[i],str[i-1]);
		i--;
		}
	}
	
	printf("%s\n",str);
	return 0;
}




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值