linux c unicode,各位大侠：在linux下如何用C实现汉字转unicode码。比如：“中国”转成“5E5D 66EF”，在线等~~...

辉煌与毁灭

于 2021-05-27 08:27:31 发布

阅读量273

点赞数

文章标签： linux c unicode

满意答案

qjmcspr8

2013.03.13

采纳率：54% 等级：12

已帮助：5205人

/* Copyright (C) 2010 by Xingyou Chen

*

* Test OS is Debian squeese AMD64 , source file stored in UTF-8

* If another encoding is used, this program may fail

*/

#include /* printf() from here */

int main()

{

int i = 0; /* for loop */

char orig[6] = "中国"; /* demo text, Chinese char is 3 byte long */

unsigned short dest[2]; /* two 2-byte variable */

for(i = 0; i < 2; i++)

{ /* Don't understand? See UTF-8 and Unicode encoding */

dest[i] = (orig[3*i] & 0x1F) << 12;

dest[i] |= (orig[3*i + 1] & 0x3F) << 6;

dest[i] |= (orig[3*i + 2] & 0x3F);

printf("%x", dest[i]);

}

printf("\n");

return 0;

}

====================================================

“中国”： UTF-8 e4b8ad e59bbd Unicode 4e2d 56fd

你给出的那个编码该是不正确的。这里只做了UTF-8到UCS-2的转换，

中文编码不少，没功夫全写出来(也写不全)，UTF-8是我平时用的。

在开源环境中，这个根本不是问题，可以参考zh-autoconvert的源代码：

http://ftp.de.debian.org/debian/pool/main/z/zh-autoconvert/zh-autoconvert_0.3.16.orig.tar.gz

它提供了多种中文编码间相互转换的C语言代码，找你需要的吧。

00分享举报

辉煌与毁灭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。