【字符串转置】
字符串包含长度不等的字符,eg "ab张三cde李f四21王二gh"
【背景知识】
ASCII码字符值都小于0x80 而汉字的两个字符一般都是0x80以上第一个字节是必需为0x80以上,第二个字符未扩展之前GBK码都是0x80以上,扩展后,一些自定义字,完全无视ASCII码规则了,第二个字节可能是个字母,这样的情况多见于生辟字,自造字
标准的国标码中汉字的首字节和次字节都在区位码范围内,双字节符号至少也是首字节大于0x80
即使是生辟字,至少也尊守了首字节大于0x80,如果用有符号数来检查,则首字是个负数
下面提供两种方法:
(1)分别是开辟新数组复制
(2)原地双重转置
注意点:
char型的范围为-128~127,所以带汉字的字符串需要unsigned char 数组存储;
汉字占用两个字节(字符),且高低字节顺序不能转置;
#include<stdio.h>
#include<iostream>
#include<string>
using namespace std;
int main(){
unsigned char str[20];
int i=0,len=0;
scanf("%s",str);
while( str[len]!='\0')
len++;
printf("%d\n%s\n",len,str);
unsigned char *res=new unsigned char[len];
//法1:开辟等长字符数组
while(str[i]!='\0')
{
if(str[i]<0x80) //非汉字判断
{
res[len-i-1]=str[i];
i++;
}
else
{
res[len-i-2]=str[i];
res[len-i-1]=str[i+1];
i+=2;
}
}
res[len]='\0';
printf("%s\n",res);
//法2:原地交换
unsigned char temp;
for(i=0;i<len/2;i++) //全部转置
swap(str[i],str[len-1-i]);
for(i=len-1;i>0;i--) //汉字修正
{
if(str[i]>0x80)
{
swap(str[i],str[i-1]);
i--;
}
}
printf("%s\n",str);
return 0;
}