转自:http://www.sudu.cn/info/article/articleInfo.php?aId=286993
由于qt返回的是Unicode编码,譬如你在LineEdit中直接输入中文,返回的就是??,qt中能直接使用QTextCodec来转换字符串的编码.
QString string;
string=LineEdit1->text(); //取得LineEdit1返回的文字
QTextCodec *codec=QTextCodec::codecForName("GBK");
//转换编码
QCString
chinese_string=codec->fromUnicode(string);//用QCString来存储返回的多字节编码
当然,你在头文件中就必需加入
#include
#include
#include
4.QTextStream对中文的支持
QTextCodec* codec = QTextCodec::codecForName("GBK"); /* 当前编码为"GBK" */
QTextStream mystream(&file);
mystream.setCodec(codec);
5. QCString&QString
QCString中不以unicode编码
QString以unicode为编码.
qt内部使用unicode为编码,所以如果要在qt的部件如multilineedit中显示中文,则需要将非unicode的字符转换成unicode字符.
QCString locallyEncoded = "中国人不是东亚病夫"; // text to convert
QTextCodec *codec = QTextCodec::codecForName("GBK"); // get the codec for GBK
QString unicodeString = codec->toUnicode( locallyEncoded );
Qt 国际化编程
本篇讨论 Qt 库对国际化的支持
,将介绍 Qt 对文本显示,输入和打印的支持,和怎么 使用Qt 研发国际化的软件。
Qt 目前的版本(2.2.4)对国际化的支持已相当完善。 在文本显示上,Qt 使用了Unicode 作为内部编码,能同时支持多种编码。 为 Qt 增加一种编码的支持也比较方便,只要 增加该编码和Unicode的转换编码便能了。 Qt 目前支持ISO标准编码ISO 8859-1, ISO 8859-2,ISO 8859-3,ISO 8859-4,ISO 8859-5,ISO 8859-7,ISO 8859-9,和 ISO 8859-15(对于阿拉伯语和希伯来语的支持正在研发之中),中文GBK/Big5,日文 eucJP/JIS/ShiftJIS,韩文eucKR,俄文KOI8-R。 当然也能直接使用UTF8编码。
Qt 使用了自己定义的Locale机制,在编码支持和信息文件(Message File)的翻译上弥补 了目前Unix上所普遍采用Locale和gettext的不足之处。 Qt 的这种机制能使 Qt 的同一 组件(QWidget)上同时显示不同编码的文本。 比如,Qt 的标签上能同时使用中文简体 和中文繁体文本。
在文本输入上,Qt 采用了XIM(X Input Method)标准协议,能直接使用XIM输入服务器。 由于目前的绝大多数输入服务器都是针对单一语言的,所以在 Qt 的标准输入组件( QLineEdit,QMultiLineEdit)中的输入受到单一编码的限制,Qt 还不支持动态转换编码 输入的支持,这是他的不足之处。
1. Qt 的文本显示
像普通的国际化过程相同,Qt 使用了类似GNU gettext相同的函数 QObject::tr(),他 用于从Qt的信息文件 .qm 中取出信息,这些信息是经过 Qt 的工具处理的。 Qt在处理 编码时还使用了 QTranslator 类,可用于指定整个应用软件的 的信息文件。
使用 Qt 编写国际化的程式,最佳不要在程式中直接使用特别编码的文本。 比如要 编写一中文界面的 Qt 程式,应该在程式中使用英文,程式编写完成后,把文本提取 出来翻译。 这样,程式还能根据Locale的不同,支持多种语言。 下面介绍怎么在 Qt 程式中标注字符串,怎么提取并翻译文本。
下面是一段使用了 QObject::tr()的代码,他建立了一个弹出菜单,菜单项是"Quit", 他被放置在菜单条上,在菜单条上显示的是标签"File"。
QPopupMenu* popup;
popup = new QPopupMenu( this );
popup->insertItem( tr("&Quit"),qApp,SLOT(quit()) );
menubar->insertItem( tr("&File"),popup );
对 于绝大多数情况,能用上述方法处理。不过有时在定义某些变量中使用的字符 串,不能使用上述方法,不过为了让Qt提取并翻译该字符串,必须用 某种方法标志出 来。Qt 定义了 QT_TR_NOOP() 和 QT_TRANSLATE_NOOP() 来标志他们。前者用于单个字 符串,后者用于多个字符串。比如,
static const char* strings[] = {
QT_TR_NOOP( "Hello" ),
QT_TR_NOOP( "World" )
};
有时需要使用printf/sprintf之类的函数动态生成字符串,比如,
QStings s;
s.sprintf( "Button %d",i );
but->setText( s );
对这种使用方式的国际化是使用 arg() 函数。
QString s = tr( "Button %1" ).arg(i);
but->setText( s );
提取上述信息的方法是使用 Qt 提供的工具 findtr 命令:
findtr [filename].cpp > i18n.po
他类似于GNU的 xgettext,上述文件的提取信息文件内包含,
....
"Content-Type: text/plain; charset=iso-8859-1\n"
#: i18n.cpp:34
msgid "ExampleWidget::&File"
msgstr ""
...
接 下来是文本翻译过程。 在Qt中翻译信息文件时应该注意以下事项: (1) 提取的 信息文件的编码是iso-8859-1,在翻译成某种语言(编码)时应该 注意改动他的 字符集,比如对中文GB2312和Big5编码,应该是, "Content-Type: text/plain; charset=gb2312\n"或"Content-Type: text/plain; charset=big5\n"。 (2) 提取的信息有一个范围,比如上面的文件指定的范围是 ExampleWidget, 在翻译 前应该把他去掉,变成 msgid "::&File"。(3) 被翻译的字符串可能含有加速键 符号,如 "&File"中的"F",如果翻译成中文最佳保留该信息,他能翻译成 "文件(&F)"。
对于翻译后的文件(比如上面的翻译文件存为 i18n_gb.po),必须使用 Qt 提供的 工具 msg2qm 把他转换为 .qm 文件才能使用,
> msg2qm i18n_gb.po i18n_gb.qm
他类似于GNU的 msgfmt 命令。翻译后的文件能用Qt程式直接调用。
QTranslator *translator = new QTranslator(0);
translator->load("i18n_gb.qm",".");
qApp->installTranslator(translator);
此外,Qt 还提供了类似于 msgmerge 的工具 mergetr,他用于把新提取的信息 文件和已翻译过的信息文件融合起来,在此不再赘述。
在 Qt 中也能直接使用 QTextCodec 来转换字符串的编码,这为在Qt下研发纯 中文软件带来了便利条件,不过这种方法不符和国际化/本地化的习惯,
char *string = "中文和English混和字符串!"
QTextCodec* gbk_codec = QTextCodec::codecByName("GBK");
QString gbk_string = codec->toUnicode(string);
QLabel *label = new QLabel(gbk_string);
如果使程式只支持一种编码,也能直接把整个应用程式的编码设置为GBK编码, 然后在字符串之前 加tr(QObject::tr),
qApp->setDefaultCodec( QTextCodec::codecForName("GBK") );
QLabel *label = new QLabel( tr("中文标签") );
如果使Qt根据Locale的环境变量取得字符集,能使用 QString::fromLocal8Bit(str)。
本节的例子请参见 qt-i18n-example.tar.gz
2. Qt 的文本输入
在 输入方面,Qt 的输入条(QLineEdit)和编辑区(QMultiLineEdit)都支持 XIM,只要配 合相应的输入服务器,便能输入中文/日文/韩文。目前有许多支持XIM的软件,比如 中文: Chinput/xcin/rfinput/q9,日文: kinput2/skkinput,韩文: ami/hanIM。
Qt程式的缺省输入风格是OverTheSpot风格,他也支持 OffTheSpot风格和 Root风格。 用户能在起动程式时在命令行指定输入风格,比如对程式app,
./app -inputstyle overthespot #缺省风格,光标跟随
./app -inputstyle offthespot
./app -inputstyle root
经过 MiziLinux 补丁的Qt-2.2.0 支持 OnTheSpot 输入风格,并且把他作为 缺省的输 入风格。请参见
Qt 中的所有一个 Widget 都能接受输入,只要他能有键盘聚焦(Keyboard Focus)。所以对特别 Widget 的输入处理只需要截获键盘输入,获取从XIM服务器 来的字符串。 对于OverTheSport风格的支持,刷新XIM输入服务器的位置即可。
3. Qt 的打印
在打印方面,XWindow下的 Qt 生成PostScript并使用lpr打印。 他含有QPrinter类, 能方便地支持输出页面的控制。 对于中文打印,必须修正PostScript文件的输出 部分。
TOpia中文化
一:字符集介绍
我国已颁布了多种中文信息编码标准,常用的有:GB2312-1980、GB12345、GB13000(GBK)及最新标准GB18030,其中 GB13000是对GB2312的扩展,又常被成为GBK,GB18030向下兼容GB2312和GBK,中文WINDOW98、中文WIN2000操作 系统采用的中文字符集是GB2312。
GB2312字库仅覆盖双字节部分,存储位置索引是编码中每字节的第8bit置0得来的,如A1A1编码汉字在字库中的索引是2121,而非A1A1。以下是他的编码规则:
单字节:00~7F
双字节:A1~F7 A1~FE
GBK的编码规则是:
单字节:00~7F
双字节:81~FE 40~7E
80~FE
GB18030是最新的汉字编码标准,其编码为一、二、四变长编码:
单字节:00~7F
双字节:81~FE 40~7E
80~FE
四字节:81~FE 30~39 81~FE 30~39
Unicode编码采用等长编码,二个字节表示一个字符编码,对于ASCII码也采用双字节来表示,unicode使用二维空间来描述编码空间,平面分为256行、256列,对应于编码的高低字节。
二:Qt 国际化编程
在 文本显示上,Qt 使用了Unicode 作为内部编码,为了程式的国际化,通常我们在文本显示的地方不直接输入本地字符,用英文代替,比如要编写一中文界面的 Qt 程式,应该在程式中使用英文,程式编写完成后,把文本提取出来翻译。对于需要翻译的地方,首先是在该文本处用tr()函数标识,同时制作出.qm信息文 件,并在程式中加入QTranslator即可。比如我们在某一程式中有如下语句:
setCaption(tr(“main window”));
为了能显示中文,有两种方法:
方法一:
l 修改工程文件,加上TRANSLATIONS = xxx.ts
l lupdate 工程文件名
l 用linguist编辑刚生成的xxx.ts文件并保存
l lrelease 工程文件名 xxx.qm
l 在main.cpp中加入QFont font1(“unifont”" target="_blank">http://www.mizi.com/ko/kde/doc/onthespot/onthespot.html。
Qt 中的所有一个 Widget 都能接受输入,只要他能有键盘聚焦(Keyboard Focus)。所以对特别 Widget 的输入处理只需要截获键盘输入,获取从XIM服务器 来的字符串。 对于OverTheSport风格的支持,刷新XIM输入服务器的位置即可。
3. Qt 的打印
在打印方面,XWindow下的 Qt 生成PostScript并使用lpr打印。 他含有QPrinter类, 能方便地支持输出页面的控制。 对于中文打印,必须修正PostScript文件的输出 部分。
TOpia中文化
一:字符集介绍
我国已颁布了多种中文信息编码标准,常用的有:GB2312-1980、GB12345、GB13000(GBK)及最新标准GB18030,其中 GB13000是对GB2312的扩展,又常被成为GBK,GB18030向下兼容GB2312和GBK,中文WINDOW98、中文WIN2000操作 系统采用的中文字符集是GB2312。
GB2312字库仅覆盖双字节部分,存储位置索引是编码中每字节的第8bit置0得来的,如A1A1编码汉字在字库中的索引是2121,而非A1A1。以下是他的编码规则:
单字节:00~7F
双字节:A1~F7 A1~FE
GBK的编码规则是:
单字节:00~7F
双字节:81~FE 40~7E
80~FE
GB18030是最新的汉字编码标准,其编码为一、二、四变长编码:
单字节:00~7F
双字节:81~FE 40~7E
80~FE
四字节:81~FE 30~39 81~FE 30~39
Unicode编码采用等长编码,二个字节表示一个字符编码,对于ASCII码也采用双字节来表示,unicode使用二维空间来描述编码空间,平面分为256行、256列,对应于编码的高低字节。
二:Qt 国际化编程
在 文本显示上,Qt 使用了Unicode 作为内部编码,为了程式的国际化,通常我们在文本显示的地方不直接输入本地字符,用英文代替,比如要编写一中文界面的 Qt 程式,应该在程式中使用英文,程式编写完成后,把文本提取出来翻译。对于需要翻译的地方,首先是在该文本处用tr()函数标识,同时制作出.qm信息文 件,并在程式中加入QTranslator即可。比如我们在某一程式中有如下语句:
setCaption(tr(“main window”));
为了能显示中文,有两种方法:
方法一:
l 修改工程文件,加上TRANSLATIONS = xxx.ts
l lupdate 工程文件名
l 用linguist编辑刚生成的xxx.ts文件并保存
l lrelease 工程文件名 xxx.qm
l 在main.cpp中加入QFont font1(“unifont”
,16,50,FALSE,QFont::Unicode);
qApp->setFont(font1);
QTranslator *translator = new QTranslator(0);
translator->load("xxx.qm",".");
qApp->installTranslator(translator);
方法二:
l findtr 文件名(通常为CPP文件) > xxx.po
l 编辑po文件,其中charset需由iso-8859-1改为GB2312,然后将“main window”翻译成“主窗口”
l msg2qm ?scope zh_CN.GB2312 xxx.po xxx.q