c++中的string对象的size()和length(),返回的都是字节个数,如何获取字符个数呢?(尤其是字符串里面包含了中文),如下:
#include <iostream>
using namespace std;
//获取utf-8字符个数(utf-8下,英文字符一个站位一个字节,中文字符一个站位3个字节)
static int getUtf8LetterNumber(const char *s)
{
int i = 0, j = 0;
while (s[i])
{
if ((s[i] & 0xc0) != 0x80) j++;
i++;
}
return j;
}
int main(int argc, char const *argv[])
{
string str = "好好学习";
cout << "utf-8字节个数是(默认安装utf-8编码在内存中):" << str.length() << endl;
char * strc = new char[strlen(str.c_str())+1];
strcpy(strc, str.c_str());
cout << "utf-8字节字符串(mac下默认安照utf-8解码,window下按照ansi):" << strc << endl;
int count = getUtf8LetterNumber(strc);
cout << "字符个数是:" << count << endl;
return 0;
}
上面代码运行环境是MAC,如果在Windows下请使GBK2312编码解码,当然getUtf8LetterNumber也就变成了getGBK2312LetterNumber,在内存中的字节个数也不一样。