可以使用mb_substr()函数来截取字符串,例如:
$str ='this is 测试字符串';
echo mb_substr($str, 0, 6, 'utf-8');//如果省略第四个参数,可以加入mb_internal_encoding("UTF-8");显示设置编码
除了mb_substr()按字来切分字符,还可以使用mb_strcut()按字节来切分字符,这两个函数处理的字符串都不会产生半个字符的现象。
需要注意的是,mb_strsub()并不是PHP核心函数,使用前需要确保在php编译模块时加入mbstring的支持。
附:各编码格式定义的中文字符长度是不同的,UTF-8:中文字符占3个字节;GB2312:中文字符占2个字节等。
另如果不使用mbstring模块,可以自定义函数按字符来截取字符串,代码如下:
<?
/*
* UTF-8字符串截取
* $str 要截取的字串
* $start 截取起始位置
* $length 截取长度
*/
function utf8_cutStr($str,$start,$length) {
$restr = '';
$j = 0;
$end = $length + $start - 1;
$plen = strlen($str);
for($i=0;$i<$plen;$i++) {
$restr .= ord($str[$i])>127 ? $str[$i].$str[++$i].$str[++$i] : $str[$i]; //区分英文和中文
$j++;
if ($j < $start){$restr = '';}
if ($j >= $end){break;}
}
$restr .='';
return $restr;
}
$str = '中新网9月24日电 二十国集团(G20)领导人第三次金融峰会今日将在美国匹兹堡召开。';
echo $str;
echo '<br>';
echo utf8_substr($str,0,25);
echo '<br>';
?>