php针对中文的字符串函数,PHP支持多种编码截取中文字符串的函数

PHP支持多种编码截取中文字符串的函数

PHP

#截取中文字符串 #函数2012-10-29 15:08

通过使用多种方法来实现中文字符串的完美截取,在未安装mbstring 和 iconv扩展情况下支持UTF-8、GBK、GB2312、BIG5编码,安装上述扩展后支持的编码更多,详细情况参考函数说明。

共有三种方法1、mb_substr() 需要 mbstring 扩展

2、iconv_substr() 需要 iconv扩展

3、正则匹配,默认支持

三种方法优先顺序从上至下,上一种方法不可用则自动使用下一种方法。

/**

* 字符串截取,支持中文和其他编码

*

* @author http://yige.org/php/

* @param string $str 需要转换的字符串

* @param string $start 开始位置

* @param string $length 截取长度

* @param string $charset 编码格式

* @param string $suffix 截断字符串后缀

* @return string

*/

function substr_ext($str, $start=0, $length, $charset="utf-8", $suffix="")

{

if(function_exists("mb_substr")){

return mb_substr($str, $start, $length, $charset).$suffix;

}

elseif(function_exists('iconv_substr')){

return iconv_substr($str,$start,$length,$charset).$suffix;

}

$re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";

$re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";

$re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";

$re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";

preg_match_all($re[$charset], $str, $match);

$slice = join("",array_slice($match[0], $start, $length));

return $slice.$suffix;

}

相关文章

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值