JS计算UTF8字符串占用字节数(escape版与UTF8专用版)

使用escape是为了使所有编码都转换成统一的编码格式(Unicode), 如GBK编码的"中国", 与UTF8编码的"中国",它们的escape返回值都是一样的,所以代码具有通用性,且escape在JS1.0已经有了,各浏览器都通用

如果不考虑通用性,且html为UTF8编码的,可以用UTF8版本

escape版:

  1. function utf8_strlen(str)
  2. {
  3.     var str_encode = escape(str);
  4.     var cnt = 0;
  5.     for( i=0; i<str_encode.length; i++)
  6.     {
  7.         if( str_encode.charAt(i) == "%")
  8.         {
  9.             if( str_encode.charAt(i+1) == "u" )
  10.             {
  11.                 var value = parseInt(str_encode.substr(i+2,4),16);
  12.                 if( value < 0x0800)
  13.                 {
  14.                     cnt += 2;
  15.                 }
  16.                 else
  17.                 {
  18.                     cnt += 3;
  19.                 }
  20.                 i = i+5;
  21.             }
  22.             else
  23.             {
  24.                 cnt++;
  25.                 i = i+2;
  26.             }
  27.         }
  28.         else
  29.         {
  30.             cnt++;
  31.         }
  32.     }
  33.     return cnt;
  34. }

 

UTF8专用版:

  1. function utf8_strlen2(str)
  2. {
  3.     var cnt = 0;
  4.     for( i=0; i<str.length; i++)
  5.     {
  6.         var value = str.charCodeAt(i);
  7.         if( value < 0x080)
  8.         {
  9.             cnt += 1;
  10.         }
  11.         else if( value < 0x0800)
  12.         {
  13.             cnt += 2;
  14.         }
  15.         else 
  16.         {
  17.             cnt += 3;
  18.         }
  19.     }
  20.     return cnt;
  21. }

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值