以前我处理截取字符串为了防止截出乱码都是把汉字和英文当一个字符处理。
但这样处理非常不利于上下行文字对齐。
最后想了如下办法。。虽然不高效,但算是解决问题了……
/**
* 截取字符串(汉字算2个字符并且防止截出乱码--目前只支持从第0位开始截取)
*
* @param String $string 要截取的字符串
* @param Int $start 从第几位开始截
* @param Int $length 要截取的长度
* @param String $fixStr 当字符长度大于$end时,给字符追加的字符
*/
function s_substr($string,$start,$length = null,$fixStr = '')
{
if (!$string || empty($string)) {
return $string;
}
$maxLen = ($length) ? $length - $start : $start;
//如果字符总长度大于要截取的长度,那么少截取“$fixStr长度”个字符,追加$fixStr
if (strlen($string) > $maxLen) {
$maxLen = $maxLen - strlen($fixStr);
}
for ($i = $start; $i < $maxLen; $i++)
{
if (ord(substr($string, $i, 1)) > 0xa0) {
if ($i + 1 == $maxLen) {
//如果截取的最后一字是汉字,那么舍弃该汉字,结束截取
break;
} else {
//如果是中文,截取2个字符
$strRes .= substr($string, $i, 2);
$i++;
}
} else {
//如果是英文,截取1个字符
$strRes .= substr($string, $i, 1);
}
}
if (strlen($string) > $maxLen) {
$strRes .= $fixStr;
}
return $strRes;
}
例:
$str = 'a我b们c是中国人';
echo s_substr($str,0,10,'..');
目前只支持从第0位开始截取,还有待完善。。。