在JavaScript中检测含中文的字符串在UTF-8编码下占用的字节数

5 篇文章 0 订阅

1. 需求

在前台向后台传输数据时,如果后台需要校验所传输的字符串长度,且后台编码为UTF-8编码格式时(比如Golang环境),则需要此功能。

2. JS实现

2.1思路

检测每个字符在js环境下的16进制编码。

UTF-8编码规则如下:字符代码在000000 – 00007F之间的,用一个字节编码;000080 – 0007FF之间的字符用两个字节;000800 – 00D7FF 和 00E000 – 00FFFF之间的用三个字节(注: Unicode在范围 D800-DFFF 中不存在任何字符);010000 – 10FFFF之间的用4个字节。

2.2 JS代码

function str_UTF8_len(str){
    let len=0;
    //let value = [];
    for (var i = 0; i < str.length; i++) {
		let c_hex = parseInt(str.charCodeAt(i));
		if (c_hex<=0x00007f){
	        len+=1; //在UTF-8编码占用1个字节
	    }else if(c_hex>=0x000080 && c_hex<=0x0007ff){
	        len+=2; //在UTF-8编码中占用2个字节
	    }else if(c_hex>=0x000800 && c_hex<=0x00ffff){
	        len+=3; //在UTF-8编码中占用3个字节
	    }else{
	        len+=4;
	    }
	    //value.push(c_hex.toString(16));
    }
    //console.log(str,value,"长度=",len);
    return len;
}

3.测试结果

注意:“hello word”后面的冒号是中文冒号“:”

在这里插入图片描述

4. 结论

符合预期。

5.参考文献

https://m.imooc.com/wenda/detail/562773

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值