编写gbk_strlen函数,计算含有汉字的字符串长度,汉字作为一个字符处理;已知:汉字编码为双字节,其中首字节<0,尾字节在0~63以外(如果一个字节是-128~127)。
#include <iostream>
#include <string.h>
using namespace std;
int gbk_strlen(const char* str)
{
const char* p = str; //p用于后面遍历
while(*p) //若是结束符0,则结束循环
{
if(*p < 0 && (*(p+1)<0 || *(p+1) < 63)) //中文汉字情况
{
str++; //str移动一位,p移动移动2位,因此长度加1
p += 2;
}
else
{
p++; //str不动,p移动一位,长度加1
}
}
return p-str; //返回地址之差
}
int main()
{
char str[] = "abc你好123中国456";
cout<<gbk_strlen(str)<<endl;
}
gbk_strlen函数中,使用了两个指针指向的地址之差来获得字符串长度。当遇到中文双字节时,由于中文汉字占两个字节,因此p移动两个指向中文汉字的后一个字符;而同时为了时汉字的长度算一个,则需要将str移动一位
输出
13