我在《转用PHP截断函数mb_substr()》这篇文章说过,由于主机对 mb_strimwidth() 函数支持不够好(主要是无法解决)——会出现乱码,所以我专用 php 的另外一个支持中文字符串截断函数 mb_substr(),但:
mb_substr() 函数的文字个数中,英文字母也算1个,这样就造成带有中英文字符的字符串截取后的长短差异太大,不美观啊。
于是想起以前收录过的一段支持utf-8字符串截取的代码,但以前收录时忘了哪里收录的,貌似也没有源代码出处,我稍微改下,用法类似 mb_strimwidth()。不同的是文字个数计算,mb_strimwidth() 中的长度是2个算一个中文字符;而现在这个新写的函数是2个英文字母算1个字符来计算的,中文是1对1。
例如:ZWWoOoOo的博客
总数字是:7个
下面是我修改过的函数代码:(代码扔到主题文件 functions.php 里面)
/* utf-8 字符串截取函数 edit by zwwooooo $sourcestr:要截取的字符串,默认空 $i:开始截取地方,默认0 $cutlength:截取长度(文字个数),默认150 $endstr:截取后的字符串末尾字符串,默认是 “....” */ function z_substr($sourcestr='',$i=0,$cutlength=150,$endstr='...') { $str_length=strlen($sourcestr);//字符串的字节数 while (($n<$cutlength) and ($i<=$str_length)) { $temp_str=substr($sourcestr,$i,1); $ascnum=Ord($temp_str);//ascii码 if ($ascnum>=224) { $returnstr=$returnstr.substr($sourcestr,$i,3); $i=$i+3; $n++; }elseif ($ascnum>=192) { $returnstr=$returnstr.substr($sourcestr,$i,2); $i=$i+2; $n++; }else { $returnstr=$returnstr.substr($sourcestr,$i,1); $i=$i+1; $n=$n+0.5; } } if($i<$str_length)$returnstr.=$endstr; return $returnstr; }
调用方法:参数说明看上面代码注释。
<?php echo z_substr($sourcestr, $i, $cutlength, $endstr); ?>
具体应用可以参考《mb_strimwidth函数的简单应用》。
就这样,完。
转自《 utf-8字符串截断函数》