前言
经常会有从C中返回的字符串中带有中文的需求,带有中文的字符串需要特别处理一下,否则拿到的是乱码
c/c++返回中文给java时会乱码,是因为java和c/c++的编码格式不一样,这里先了解一下编码:
- java内部是使用的16bit的unicode编码(utf-16)来表示字符串的,无论英文还是中文都是2字节;
- jni内部是使用utf-8编码来表示字符串的,utf-8是变长编码的unicode,一般ascii字符是1字节,中文是3字节;
- c/c++使用的是原始数据,ascii就是一个字节,中文一般是GB2312编码,用2个字节表示一个汉字。
详细了解看这里
实现代码如下:
jstring JNICALL Java_clz_Register_getStringZH(JNIEnv *env, jobject obj){
char *pat="我在 上海";
///1 获取Sting的class
jclass clazz=(*env)->FindClass(env, "java/lang/String");
if(clazz==NULL){
return NULL;
}
///2获取String的构造方法 public String(byte bytes[], String charsetName)
jmethodID jmID = (*env)->GetMethodID(env, clazz, "<init>","([BLjava/lang/String;)V");
///3处理需要传的字符串
jbyteArray bytes=(*env)->NewByteArray(env,strlen(pat));
(*env)->SetByteArrayRegion(env,bytes,0,strlen(pat),(jbyte*)pat);
///4 设置 编码
jstring jEncoding=(*env)->NewStringUTF(env,"GB2312");
///5 生成string 相当于java的new String(byteArray, encoding);
return (*env)->NewObject(env,clazz,jmID,bytes,jEncoding);
}