php 中英字符串截取，支持utf8 和gbk

最新推荐文章于 2024-11-14 15:22:28 发布

weixin_30414635

最新推荐文章于 2024-11-14 15:22:28 发布

阅读量62

点赞数

文章标签： php

原文链接：http://www.cnblogs.com/say0507/archive/2011/03/30/2000103.html

版权

今天在遇到了一个中英字符串截取的问题，在gbk里中文里每个字占两字节，如果全是中文的话，用substr()函数就可以实现了，但中英都有的话就麻烦了，在以前收藏的代码里找到了一个不错的函数，很好的实现了截取的功能

function get_word( $string , $length , $dot = ' .. ' , $charset = ' gbk ' ) {

if ( strlen ( $string ) <= $length ) {
return $string ;
}

$string = str_replace ( array ( ' 　 ' , '   ' , ' & ' , ' " ' , ' < ' , ' > ' ) , array ( '' , '' , ' & ' , ' " ' , ' < ' , ' > ' ) , $string );

$strcut = '' ;
if ( strtolower ( $charset ) == ' utf-8 ' ) {

$n = $tn = $noc = 0 ;
while ( $n < strlen ( $string )) {

$t = ord ( $string [ $n ]);
if ( $t == 9 || $t == 10 || ( 32 <= $t && $t <= 126 )) {
$tn = 1 ; $n ++ ; $noc ++ ;
} elseif ( 194 <= $t && $t <= 223 ) {
$tn = 2 ; $n += 2 ; $noc += 2 ;
} elseif ( 224 <= $t && $t < 239 ) {
$tn = 3 ; $n += 3 ; $noc += 2 ;
} elseif ( 240 <= $t && $t <= 247 ) {
$tn = 4 ; $n += 4 ; $noc += 2 ;
} elseif ( 248 <= $t && $t <= 251 ) {
$tn = 5 ; $n += 5 ; $noc += 2 ;
} elseif ( $t == 252 || $t == 253 ) {
$tn = 6 ; $n += 6 ; $noc += 2 ;
} else {
$n ++ ;
}

if ( $noc >= $length ) {
break ;
}

}
if ( $noc > $length ) {
$n -= $tn ;
}

$strcut = substr ( $string , 0 , $n );

} else {
for ( $i = 0 ; $i < $length ; $i ++ ) {
$strcut .= ord ( $string [ $i ]) > 127 ? $string [ $i ] . $string [ ++ $i ] : $string [ $i ];
}
}

return $strcut . $dot ;
}

转载于:https://www.cnblogs.com/say0507/archive/2011/03/30/2000103.html

weixin_30414635

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。