jni的字符转换

最新推荐文章于 2024-01-12 09:25:47 发布

weixin_33937778

最新推荐文章于 2024-01-12 09:25:47 发布

阅读量88

点赞数

文章标签： c/c++ java

原文链接：http://blog.51cto.com/kingzeus/1352480

版权

一.相关概念

java内部是使用16bit的unicode编码（UTF-16）来表示字符串的，无论中文英文都是2字节；

jni内部是使用UTF-8编码来表示字符串的，UTF-8是变长编码的unicode，一般ascii字符是1字节，中文是3字节；

明确了概念，操作就比较清楚了。下面根据字符流的方向来分别说明一下

1、java --> c/c++

这种情况中，java调用的时候使用的是UTF-16编码的字符串，jvm把这个字符串传给jni，c/c++得到的输入是jstring，这个时候，可以利用jni提供的两种函数，一个是GetStringUTFChars，这个函数将得到一个UTF-8编码的字符串；另一个是 GetStringChars这个将得到UTF-16编码的字符串。无论那个函数，得到的字符串如果含有中文，都需要进一步转化成GB2312的编码。示意图如下：

2、c/c++ --> java

jni返回给java的字符串，c/c++首先应该负责把这个字符串变成UTF-8或者UTF-16格式，然后通过NewStringUTF或者NewString来把它封装成jstring，返回给java就可以了。

如果字符串中不含中文字符，只是标准的ascii码，那么使用GetStringUTFChars/NewStringUTF就可以搞定了，因为这种情况下，UTF-8编码和ascii编码是一致的，不需要转换。

但是如果字符串中有中文字符，那么在c/c++部分进行编码转换就是一个必须了。我们需要两个转换函数，一个是把UTF8/16的编码转成GB2312；一个是把GB2312转成UTF8/16。

这里要说明一下：linux和win32都支持wchar，这个事实上就是宽度为16bit的unicode编码UTF16，所以，如果我们的 c/c++程序中完全使用wchar类型，那么理论上是不需要这种转换的。但是实际上，我们不可能完全用wchar来取代char的，所以就目前大多数应用而言，转换仍然是必须的。

再更新下：很多linux版本的wchar_t其实是32位，4字节的，即ucs4。所以处理的时候需要注意下

转载于:https://blog.51cto.com/kingzeus/1352480

weixin_33937778

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
jni的字符转换

一.相关概念java内部是使用16bit的unicode编码（UTF-16）来表示字符串的，无论中文英文都是2字节；jni内部是使用UTF-8编码来表示字符串的，UTF-8是变长编码的unicode，一般ascii字符是1字节，中文是3字节；明确了概念，操作就比较清楚了。下面根据字符流的方向来分别说明一下1、java --> c/c++这种情况中，java调用的时候使用...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。