一般说来,字符分为ASCII集,MultiByte集和WideChar集。
(1)ASCII:用一个字节表示少量的英文字符。
(2)MultiByte:一般指使用一个字节或者两个字节来表示一个字符的方式,当第一位为0时,用第一个字节表示半角字符,否则是双字节的全角字符。GBK,GB2312,BIG5,GB18030等都是是双字节字符集 (DBCS);可以使用string类型表示。
(3)WideChar:常用于Unicode,使用两个字节表示一个字符,通常使用wchar_t,wstring来存储。
当使用QT向数据库中插入中文字符时,产生很多乱码,但是并不报错。幸好发现QT中一个QTextCodec类型,在<qtextcodec.h>中定义。qt对默认的是unicode编码,但是在Linux下TextCodec通常是GBK的,而Windows下通常是GB18030的。
所以在Linux中,可以定义:
QTextCodec::setCodecForLocale(QTextCodec::codecForName("GBK"));
QTextCodec::setCodecForCStrings(QTextCodec::codecForName("GBK"));
QTextCodec::setCodecForTr(QTextCodec::codecForName("GBK"));
或在Windows中:
QTextCodec::setCodecForLocale(QTextCodec::codecForName("GB18030"));
QTextCodec::setCodecForCStrings(QTextCodec::codecForName("GB18030"));
QTextCodec::setCodecForTr(QTextCodec::codecForName("GB18030"));
一种通用的写法是:
QTextCodec::setCodecForLocale(QTextCodec::codecForLocale());
QTextCodec::setCodecForCStrings(QTextCodec::codecForLocale());
QTextCodec::setCodecForTr(QTextCodec::codecForLocale());
在使用时:
使用QString::fromLocal8Bit()转换成QString;
使用QString::ToStdString()得到正确的string类型。