utf-8字符串截断函数

最新推荐文章于 2022-03-20 21:41:22 发布

概念西瓜

最新推荐文章于 2022-03-20 21:41:22 发布

阅读量720

点赞数

分类专栏： php 乱码截断文章标签： php

php 同时被 3 个专栏收录

68 篇文章 0 订阅

订阅专栏

乱码

1 篇文章 0 订阅

订阅专栏

截断

1 篇文章 0 订阅

订阅专栏

我在《转用PHP截断函数mb_substr()》这篇文章说过，由于主机对 mb_strimwidth() 函数支持不够好（主要是无法解决）——会出现乱码，所以我专用 php 的另外一个支持中文字符串截断函数 mb_substr()，但：

mb_substr() 函数的文字个数中，英文字母也算1个，这样就造成带有中英文字符的字符串截取后的长短差异太大，不美观啊。

于是想起以前收录过的一段支持utf-8字符串截取的代码，但以前收录时忘了哪里收录的，貌似也没有源代码出处，我稍微改下，用法类似 mb_strimwidth()。不同的是文字个数计算，mb_strimwidth() 中的长度是2个算一个中文字符；而现在这个新写的函数是2个英文字母算1个字符来计算的，中文是1对1。

例如：ZWWoOoOo的博客
总数字是：7个

下面是我修改过的函数代码：（代码扔到主题文件 functions.php 里面）

/*
utf-8 字符串截取函数 edit by zwwooooo
$sourcestr：要截取的字符串，默认空
$i：开始截取地方，默认0
$cutlength：截取长度（文字个数），默认150
$endstr：截取后的字符串末尾字符串，默认是 “....”
*/
function z_substr($sourcestr='',$i=0,$cutlength=150,$endstr='...')
{
	$str_length=strlen($sourcestr);//字符串的字节数
	while (($n<$cutlength) and ($i<=$str_length))
	{
		$temp_str=substr($sourcestr,$i,1);
		$ascnum=Ord($temp_str);//ascii码
		if ($ascnum>=224)
		{
			$returnstr=$returnstr.substr($sourcestr,$i,3);
			$i=$i+3;
			$n++;
		}elseif ($ascnum>=192)
		{
			$returnstr=$returnstr.substr($sourcestr,$i,2);
			$i=$i+2;
			$n++;
		}else
		{
			$returnstr=$returnstr.substr($sourcestr,$i,1);
			$i=$i+1;
			$n=$n+0.5;
		}
	}
	if($i<$str_length)$returnstr.=$endstr;
	return $returnstr;
}