众所周知String对象的length属性能够返回字符串的长度,不管字符是单字节还是双字节,都作为一个长度单位来计算。因此要准确的获取字符长度,必须通过手工来写。
下面介绍两种方式:
1、循环遍历字符串,根据字符的编码,来判断当前字符是双字节还是单字节,然后递加字符串的字节数。
<span style="font-size:14px;">String.prototype.lengthSingle = function(str){
var b = 0;
for(var i=0,l=str.length;i<l;i++){
if(this.chartCodeAt(i)>255){
b +=2;
}else{
b++;
}
}
return b;
}</span>
或者根据escape来判断是否为单字节还是双字节。escape的作用是对 String 对象编码以便它们能在所有计算机上可读。
escape 方法返回Unicode格式的字符串值。所有空格、标点、重音符号以及 其他非 ASCII 字符都用 %xx 编码代替,其中 xx 等于表示该字符的十六进制数。例如,空格返回的是 "%20 " 。 字符值大于 255 的以 %uxxxx 格式存储。 因此可以通过使用escape方法后返回的值的长度来确定是单字节还是双字节。
<pre name="code" class="javascript"><span style="font-size:14px;">String.prototype.lengthSingle = function(str){
var b = 0;
for(var i=0,l=str.length;i<l;i++){
var c = this.charAt(i);
if(escape(c).length>4){
b+=2;
}else if(c!="\r"){
b++;
}
}
return b;
}</span>
亦可以使用正则表达式来判断为单字节还是双字节。
<pre name="code" class="javascript"><span style="font-size:14px;">String.prototype.lengthSingle = function(str){
var b = 0;
for(var i=0,l=str.length;i<l;i++){
var c = this.charAt(i);
if(/^[\u0000-\u00ff]$/.test(c)){
b++;
}else{
b+=2;
}
}
return b;
}</span>
第二种方式,则是将字符串中的所有双字节字符,使用**代替,然后再统计长度。由于会使用到两次遍历,因此效率没有第一种高。故不描述了。