我们常常碰到中英文字符混合的情况。英文字符占一个字符,中文字符占两个字符(一个字符是肯定存不下的)。 当我们要对字符串中的某些中文或者英文做一些处理的时候。
我们就要去判断它们是中文字符还是英文字符之后,才能继续做下一步的处理。
char *s = "你abc";
int length = strlen(s);
length 为 5。 “你”占两个字符。
当在程序中要判断是否为中文字符,还是英文字符时,在GBK编码时将表示汉字的每位编码高位置1来区别非中文字符。
int main()
{
char *s = "你abc";
int i = 0;
while(s[i] != '\0')
{
if(!(s[i] & 0x80)) //
{
cout<<" english code"<<endl;
}else
cout<<"chinese code"<<endl;
i++;
}
return 0;
}
输出:
chinese code
english code
english code
english code
这里提供了一个判断是否为英文字符的方法:s[i] & 0x80.