php的字符串截取

最新推荐文章于 2019-07-22 16:02:12 发布

oyd

最新推荐文章于 2019-07-22 16:02:12 发布

阅读量1.6k

点赞数

分类专栏：算法文章标签： php html function css ie

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oyd/article/details/1902484

版权

算法专栏收录该内容

16 篇文章 0 订阅

订阅专栏

这个功能在php输出页面的时候很常用，就是把一个字符串截取为不大于某个长度的字符串。本身是很简单的事情，但是附加了一些需求：1，字符串中含有中文，也就是单字节双字节混着的。2，字符串中含有html代码。

对于中文截取，网上有现成的代码可以拿来用，就像这样：

function trunk( $str , $most , $append = " ... " )

{

if ( strlen ( $str ) <= $most ) {

return $str ;

}

return substr_cut( $str , $most - strlen ( $append )) . $apend ;

}

function substr_cut( $str_cut , $length ){

if ( strlen ( $str_cut ) > $length ){

for ( $i = 0 ; $i < $length ; $i ++ )

if ( ord ( $str_cut [ $i ]) > 128 ) $i ++ ;

$str_cut = substr ( $str_cut , 0 , $i );

}

return $str_cut ;

}

这里就是简单的判断一下字节是否大于128，是就往前多移一位。因为对于GB2312编码，凡双字节第一个字节都是大于128的。

至于第二个需求，含有html代码的，其实我觉得这样的要求通过css来做更加合适了。

通过设置width，height，line-height限定其块大小后，再设定overflow:hidden;就可以做到了。如果只为IE而做的话，那么有更多的CSS手段来控制超出边界后的处理。

如果一定要自己写程序处理的话，我想最好是只处理简单情况，如果仅为了截取含html代码的字符串就要写一个完全的html parser的话，未免太小题大作了。这里我写了一段仅处理成对、非嵌套情况的：

function trunkhtml( $str , $most , $append = " ... " ) {

$arr = preg_split ( " /(<[^>]*>)/ " , $str ,- 1 , PREG_SPLIT_DELIM_CAPTURE | PREG_SPLIT_OFFSET_CAPTURE);

$istag = FALSE ;

$notagstr = "" ;

foreach ( $arr as $v ) {

if ( ! $istag ) $notagstr .= $v [ 0 ];

$istag = ! $istag ;

}

if ( strlen ( $notagstr ) <= $most ) {

return $str ;

}

$str_cut = substr_cut( $notagstr , $most - strlen ( $append ));

$cut_len = strlen ( $str_cut );

$istag = FALSE ;

foreach ( $arr as $i => $v ) {

if ( ! $istag ) {

$len = strlen ( $v [ 0 ]);

if ( $cut_len > $len ) $cut_len -= $len ;

else {

$pos = $v [ 1 ] + $cut_len ;

if ( $i % 4 == 0 ) {

return substr ( $str , 0 , $pos ) . $append ;

} else {

$ret = substr ( $str , 0 , $pos ) . $append ;

if ( isset ( $arr [ $i + 1 ])) $ret .= $arr [ $i + 1 ][ 0 ];

return $ret ;

}

}

}

$istag = ! $istag ;

}

assert ( FALSE );

return $str_cut ;

}

这里做法也不复杂，先用正则把它分割开来，取出不在<>中的部分拼在一起，先用前面的substr_cut截取一次，记住最终截了多长。然后再用各个部分长度去减，减到不够的时候就确定是截在哪个位置了。因为假定html标签都是成对的，最后再判断一下是否处在一对标签中。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

oyd CSDN认证博客专家 CSDN认证企业博客

码龄22年

81: 原创

17万+: 周排名

173万+: 总排名

95万+: 访问

: 等级

8204: 积分

186: 粉丝

20: 获赞

236: 评论

64: 收藏

私信

关注

热门文章

分类专栏

UNIX 23篇
VC/MFC 3篇
Windows相关 3篇
医学 12篇
杂谈 24篇
武学 8篇
灌水机技术 4篇
算法 16篇
编程低手箴言 4篇
财经/股市 2篇
吐槽 1篇

最新评论

围棋AI之路（二）棋盘的实现
「已注销」: 现在来看很感慨啊，本来100年以后才能实现的东西，8年后就被实现了。。。技术的进步真的是非线性的，所以AGI什么时候能实现呢？哈哈
发现一个超立方体的模型，感慨人类脑子不够用呀
4166NT4.32: 链接呢？怎么没了？
发现一个超立方体的模型，感慨人类脑子不够用呀
qq_45921555: 初来乍到
EMACS 对 vi：永无止境的圣战
「已注销」: vim就是unix记事本，emacs是Scheme语言内嵌编辑器，这是起源。vim代表用适合的方式解决问题，emacs代表用一种方式解决所有问题，这是信仰。"其它编辑器"，代表你不关心编程本身，而只关心解决问题，正真程序员往往只关心编程本身而不关心问题。想当年，Borland C++ Builder Compiler，整个编译器用汇编写成，导致一人离开，Borland倒闭。这就是编程本身问题。用信仰构建世界，这就是vim emacs所讲的！！！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。