Poco的帮助文档:http://pocoproject.org/docs/index.html
在Poco中存在ASCII,Latin1,Latin9,Windows1252,UTF16,UTF8编码。
1.不同字符集之间的转换,实际上是不同字符原集的不同表示之间的转换。如果两个表示方法的原集相同,转换起来自然方便一些。Poco中提供了UnicodeConverter类用于UTF8和UTF16之间的转换。
Poco::UnicodeConverter::toUTF8(ws,uft8); // 把Unicode转成utf8
Poco::UnicodeConverter::toUTF16(uft8,ws); //把uft8围成Unicode
2. 如果两个表示方法的原集不同,则要考虑转换方向问题。比如说中文字符在ASCII码中不存在,那么毫无疑问,把中文字符转换成ASCII码自然无意义,这个方向的转换注定要失败。在Poco中,上述字符集之间的转换是用类TextConverter来实现的。下面是例子:
#include "stdafx.h"
#include "Poco/TextConverter.h"
#include "Poco/Latin1Encoding.h"
#include "Poco/UTF8Encoding.h"
#include "Poco/UTF16Encoding.h"
#include "Poco/UTF8String.h"
#include "Poco/TextIterator.h"
#include "Poco/UTF8Encoding.h"
#include "Poco/StreamConverter.h"
#include <iostream>
#include <assert.h>
using Poco::TextConverter;
using Poco::Latin1Encoding;
using Poco::UTF8Encoding;
using Poco::UTF16Encoding;
using Poco::UTF8;
using Poco::TextIterator;
using Poco::UTF8Encoding;
using Poco::OutputStreamConverter;
void TestConvert()
{
std::string latin1String("This is Latin-1 encoded text.");
std::string utf8String;
Latin1Encoding latin1;
UTF8Encoding utf8;
TextConverter converter(latin1, utf8);
converter.convert(latin1String, utf8String);
std::cout << utf8String << std::endl;
std::string latin1StringZ("中国.");
std::string utf8StringZ;
UTF16Encoding utf16;
UTF8Encoding utf8Z;
TextConverter converterZ(utf16, utf8Z);
converterZ.convert(latin1StringZ, utf8StringZ);
std::cout << utf8StringZ << std::endl;
}
void TestStream()
{
std::string latin1String("This is Latin-1 encoded text.");
Latin1Encoding latin1;
UTF8Encoding utf8;
OutputStreamConverter converter(std::cout, latin1, utf8);
converter << latin1String << std::endl; // console output will be UTF-8
}
void TestUTF8()
{
std::string s3("\303\274\303\266\303\244"); // "u"o"a
UTF8::toUpperInPlace(s3);
assert (s3 == "\303\234\303\226\303\204"); // "U"O"A
UTF8::toLowerInPlace(s3); assert (s3 == "\303\274\303\266\303\244"); // "u"o"a
}
void TestIterator()
{
std::string utf8String("This is UTF-8 encoded text.");
UTF8Encoding utf8;
TextIterator it(utf8String, utf8);
TextIterator end(utf8String);
int unicode;
for (; it != end; ++it)
{
unicode = *it;
}
}
int _tmain(int argc, _TCHAR* argv[])
{
TestLatinToUtf8();
TestStream();
TestUTF8();
TestIterator();
return 0;
}