【YashanDB知识库】GBK库,生僻字插入nvarchar2字段后乱码问题

本文内容来自YashanDB官网,具体内容可见(https://www.yashandb.com/newsinfo/7488287.html?templateId=1718516)

问题现象

如下SQL,插入的人名中有两个GBK生僻字“
”和“
”,GBK编码中没有这两个字符。

插入后,客户端utf8编码,显示为乱码。用gbk和

image2024-8-8_18-58-18

问题的风险及影响

客户端和服务端编码不同,服务端是gbk时,gbk生僻字,插入不正常。

问题影响的版本

23.2.4.14及之前版本

问题发生原因

gbk生僻字,客户端转换数据为gbk编码时,生僻字转换失败,发送给服务端存储的数据缺失,导致显示问题。

解决方法及规避方式

1、终端是utf8,这样可以输入生僻字。yasql用gbk编码,同服务端编码一样,就不会转码。用insert语句发送,之后同样的编码能正常查询显示出数据。

2、使用yasdb client库接口,yacBindParameter接口提供了utf16编码插入数据方式。如下图所示,只要不是gbk编码就能正常显示生僻字:

问题分析和处理过程

分析过程:

客户端是utf8,服务端是gbk编码的情况。

1、服务端收到客户端的数据,如下图

C1D9 GBK(临) 193 217

BAA3 GBK(海) 186 163

3F 生僻字
丢失 为63

2、insert时,yasdb中数据的字符,如下图:

4E34 utf16(临)78 52

6D77 utf16( 海)109 119

3F

3、客户终端与客户端编码不同时,存储的数据是否有问题呢?如客户终端编码为utf8,yasql为gbk、yasdb为gbk。

nvarchar2类型, 服务端中会再做转换,这里就出现了这个问题。utf8的终端,gbk的yasql,gbk的服务器情况下,插入汉字后, 数据是utf8编码,但是当成gbk编码转换成utf16,导致存储的数据不对。

如下例:

yasdb接收的数据:

yasql客户端同服务端编码相同,则不做转换,直接发送输入数据到服务端。所以下图显示的是utf8编码的’艳梅’数据

yasdb存储的数据:

下图显示,yasdb存放的就是上面的编码。0x79(121) 0x94(148) 0x46(107) 0xB8(134)

所以当终端是utf8时,yasql和yasdb是gbk时,存储在nvarchar2字段上的数据其实是错误的。所以如果数据要正确存储,yasql插入时,终端和yasql的编码必须相同。

结论:

所以在用yasql插入数据时,要保证终端与yasql的编码相同,否则数据可能存储的有问题。

经验总结

yasql编码转换过程:

1、yasql insert插入时,数据编码转换过程

输入的数据 (客户终端编码) →(转换)数据为 服务端编码(gbk)(如果yasql客户端同服务端编码相同,则不做转换,直接发送输入数据到服务端。) → 发送数据到服务端

服务端接收到数据后:nvarchar2类型,在服务端转换为utf16le编码。

2、yasql select查询时,数据编码转换过程

服务端(GBK) ->(发送数据) 客户端(UTF8) → (转换数据编码gbk->utf8)yasql客户端编码 → 终端同yasql客户端编码一致才能正常显示出来。

如果客户端是gbk,nvarchar2类型的编码转换:UTF16 → gbk

相关问题单

1、服务端gbk,nvarchar2插入gbk不识别的生僻字,插入后乱码问题

22.2.12.100 GBK库nvarchar列无法存放中文生僻字

2、服务端gbk,客户端utf8,exp导出报错转换失败,YAS-00218 string conversion failed

数据库使用GBK字符集,exp导出成csv报错

exp导出时,如上图,“世纪春城”前面两个空白字符不是空格,而是gbk的空白字,utf8编码没有这种空白字符,导致转换失败。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值