【转】javascript 中英文字符长度和截断处理

转自:http://www.cnblogs.com/darr/p/5354858.html


javascript中的String类自带的length属性 和 substr()方法虽然能判断和截取出字符个数,但是对字节个数却没有处理的方法(众所周知,中文字符占两个字节,英文只占一个)。

所以对中英文截取同样长度需要处理一下。大致有两种方法处理中英文字符:

1、把中文字符escape了,然后计算字节长度。

2、用正则表达式把中文字符转换2个字节的符号,然后计算长度。

推荐第二种方法,简单明了,速度快,效率高。

按照第二种方法,对javascript 的 String类型做以下扩展:


一.String.len() 方法,计算字符串字节个数:

String.prototype.len=function()          {                 
 return this.replace(/[^\x00-\xff]/g,"rr").length;          
}

二.String.sub(endindex) 方法,从0开始截取endindex长度的字节数。

String.prototype.sub = function(n)
{    
 var r = /[^\x00-\xff]/g;    
 if(this.replace(r, "mm").length <= n) return this;   
 // n = n - 3;    
 var m = Math.floor(n/2);    
 for(var i=m; i<this.length; i++) {    
 if(this.substr(0, i).replace(r, "mm").length>=n) {    
  return this.substr(0, i) ; }    
 } return this;   
};

三.根据unicode编码范围

String.prototype.gblen = function() {    
    var len = 0;    
    for (var i=0; i<this.length; i++) {    
        if (this.charCodeAt(i)>127 || this.charCodeAt(i)==94) {    
             len += 2;    
         } else {    
             len ++;    
         }    
     }    
    return len;    
}  


charCodeAt() 方法可返回指定位置的字符的 Unicode 编码。这个返回值是 0 - 65535 之间的整数。

方法 charCodeAt() 与 charAt() 方法执行的操作相似,只不过前者返回的是位于指定位置的字符的编码,而后者返回的是字符子串。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值