帝国CMS技术互助群:540946827 一帮大神带你装逼带你飞!还有漂亮的妹纸陪你玩哦!
strlen()函数和mb_strlen()函数
在PHP中,函数strlen()返回字符串的长度。函数原型如下:
int strlen(string string_input);
参数string_input为要处理的字符串。
strlen()函数返回字符串所占的字节长度,一个英文字母、数字、各种符号均占一个字节,它们的长度均为1。一个中午字符占两个字节,所以一个中午字符的长度是2。例如
echo strlen("www.soumov.com");
echo strlen("搜影网");
?>
“echo strlen("www.soumov.com");”的运行结果:14
“echo strlen("搜影网");”的运行结果:9
这里有一个疑问,一个中文字符不是占2个字节吗?“三知开发网”,明明是三个汉字,运行的结果怎么会是9?
原因出在这里:strlen()计算时,对于一个UTF-8的中文字符,会把它当做长度为3来处理。当出现中英文混排的情况下,怎么准确的计算字符串的长度呢?这里,得引入另外一个函数mb_strlen()。mb_strlen()函数的用法与strlen()几乎一摸一样,只是多了一个指定字符集编码的参数。函数原型为:
int mb_strlen(string string_input, string encode);
PHP内置的字符串长度函数strlen无法正确处理中文字符串,它得到的只是字符串所占的字节数。对于GB2312的中文编码,strlen得到的值是汉字个数的2倍,而对于UTF-8编码的中文,就是3倍的差异了(在UTF-8编码下,一个汉字占3个字节)。 因此,下面的代码能准确计算出中文字符串的长度:
$str = "搜影网soumovcom";
echo strlen($str)."
"; //结果:18
echo mb_strlen($str,"UTF8")."
"; //结果:12
$strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2;
echo $strlen; //结果:15
?>
原理分析:
strlen()计算时,对待UTF-8的中文字符长度是3,所以“搜影网soumovcom”的长度为3×3+9×1=18
在mb_strlen计算时,选定内码为UTF8,则会将一个中文字符当作长度1来计算,所以“搜影网soumovcom”长度为3×1+9×1=12
剩下的就是纯数学问题了,在此就不啰嗦了……
本文系剖要网原创文章,转载请注明来源!
如对本文有疑问,请提交到交流社区,广大热心网友会为你解答!! 点击进入社区
打赏一下,我们会为大家提供更多优质资源!
您的打赏将全部用来搜集更多优质资源!
扫码打赏,你说多少就多少
打开微信扫一扫,即可进行扫码打赏哦