前端的string.length和后台数据库存储的字符长度不一致

问题原因:

后台数据库使用的是UTF-8编码,一个中文字符在被存储时是3个字节

而前台一般使用获取字符长度的string.length获取的字符串长度中文依然是一个长度

英文在Unicode和UTF-8中的长度和字节都是一致的,只占用1个字节

因为汉字的unicode码区间为0x2e80-0x9fff, 所以汉字在UTF8中的长度最长为3个字节

这样导致前后台的长度校验不一致

 

当后台定义的某个字段长度较小时,如,后台定义最大50,

前台在需要校验输入长度时需要将字符串长度转换为UTF-8编码长度,这样才能保证前后台的长度校验一致性

使用下面的方法进行转换,可以获取到UTF-8的字符数组,再取长度进行校验即可

 

// 将字符串格式化为UTF8编码的字节
var writeUTF = function (str, isGetBytes) {
    var back = [];
    var byteSize = 0;
    for (var i = 0; i < str.length; i++) {
       var code = str.charCodeAt(i);
       if (0x00 <= code && code <= 0x7f) {
           byteSize += 1;
           back.push(code);
       } else if (0x80 <= code && code <= 0x7ff) {
           byteSize += 2;
           back.push((192 | (31 & (code >> 6))));
           back.push((128 | (63 & code)))
       } else if ((0x800 <= code && code <= 0xd7ff) 
            || (0xe000 <= code && code <= 0xffff)) {
           byteSize += 3;
           back.push((224 | (15 & (code >> 12))));
           back.push((128 | (63 & (code >> 6))));
           back.push((128 | (63 & code)))
       }
    }
    for (i = 0; i < back.length; i++) {
        back[i] &= 0xff;
    }
    if (isGetBytes) {
        return back
    }
    if (byteSize <= 0xff) {
       return back;
    }else{
       return back;
    }
}

writeUTF('我爱你'); 
// [230, 136, 145, 231, 136, 177, 228, 189, 160]

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值