[转发]基于XERCES-C编程中的中文(encoding)设置问题的解决方法

1。 对于文档对象DOMDocument ,在代码中一般是一个名为doc的指针,
它的方法setEncoding ,setAcutalEncoding 对于最后生成的XML代码的编码
好像是没有影响的,但是保险起见,先把他们都设置为
doc->setEncoding(XMLString::transcode("GB2312"));
doc->setAcutalEncoding(XMLString::transcode("GB2312"));
注意,最好是你在对DOM树操作前进行设置。

2。也是最重要的一点,我在网上看到大家一般是用
DOMWriter 的 writeToString 将内存中的DOM树写入文件的,
但是经过我试验,应该用 writeNode 方法将DOM树写入文件。
具体代码如下:

DOMWriter* writer = impl->createDOMWriter(); //其中的impl是文档对象实例
writer->setEncoding(XMLString::transcode("GB2312")); //注意,这和上面讲的doc不是同一个对象

XMLFormatTarget *mytarget;
mytarget = new LocalFileFormatTarget(".\example.xml"); // 这一行创建一个XMLTarget,指向你要写入的文件路径

writer->writeNode(mytarget,*doc);// doc是你的文档对象
writer->release();

用以上代码的方式生成的XML文档就是GB2312编码的了,
以后在文档中增删改查中文都没有问题了。

后记:
核心的问题实际上是不能用writeToString写入文件,改用
writeNode就可以了。由于writeToString实际上是返回了一个
char* ,然后我们又要用一些其他方式,比如fprintf等等方式,
将这个字符串写入文件,我怀疑是在这一步中,出了问题,
我们调用的写文件函数将其自动转码了。但是我将内存中
的这个char*直接输出到屏幕上的时候,居然也是UTF-16的,
估计真的是 writeToString 这个函数有问题吧。

基于XERCES-C编程的人本来就少,大部分人都是基于XERCES-J
在工作。所以XERCES-C相关的使用经验等东西网上就很少,
希望这篇文章可以帮助有需要的兄弟,同时也希望大家都把自己
的使用经验POST一下,共同进步:)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值