获取字符串中全部中文字符
^x00-x80
是全角字符的范围(注意这里有个非),通过正则来获取字符串中的全角字符。
// 获取全部中文字符(字符串) ,返回中文字符组成的数组
function getChinese(str) {
if (str == null || str == undefined || str == "") {
return [];
}
return str.match(/[^\x00-\x80]/g);
}
获取字符串实际长度(区分中英文)
原理:前128个字符就是ASCII码,占用一个字节,128个之后是扩展码(Unicode码),占用2个字节。
汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
数字:[0x30,0x39](或十进制[48, 57])
小写字母:[0x61,0x7a](或十进制[97, 122])
大写字母:[0x41,0x5a](或十进制[65, 90])
// 获取字符串实际长度(字符串),返回字符串实际长度
function getRealLength(str) {
if (str == null || str == undefined || str == "") {
return 0;
}
var len = 0;
var strLen = str.length;
for (var i = 0; i < strLen; i++) {
let charCode = str.charCodeAt(i); // 获取指定位置的字符的 Unicode 编码
if (charCode >= 0 && charCode <= 128) { // 判断 Unicode 编码 是否在0到128,原因上面有说
len += 1;
} else {
len += 2;
}
}
return len;
}