php实现中文截取无乱码的方法,php实现中文字符截取防乱码方法汇总

大家在自己的程序中相信都会经常用到截取字符串吧,但是往往遇到截取中文字符串的时候会遇到乱码的问题。很是让人头疼,接下来介绍两种方法防止截取中文字符串的时候出现乱码的问题。

首先第一种,自己写好的一个函数方便使用

利用这个函数截取就不会出现乱码了。

/**

* 支持中文字符串截取

*/

function msubstr($str, $start=0, $length, $charset="utf-8", $suffix=true){

switch($charset){

case 'utf-8':$char_len=3;break;

case 'UTF8':$char_len=3;break;

default:$char_len=2;

}

//小于指定长度,直接返回

if(strlen($str)<=($length*$char_len)){

return $str;

}

if(function_exists("mb_substr")){

$slice= mb_substr($str, $start, $length, $charset);

}else if(function_exists('iconv_substr')){

$slice=iconv_substr($str,$start,$length,$charset);

}else{

$re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";

$re['gb2312'] = "/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/";

$re['gbk'] = "/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/";

$re['big5'] = "/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/";

preg_match_all($re[$charset], $str, $match);

$slice = join("",array_slice($match[0], $start, $length));

}

if($suffix)

return $slice;

return $slice;

}

第二种是php内置的一个函数mb_substr函数

指定要截取的字符串的编码格式,就能有效的防止出现乱码了。

说明

string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )

function substr_unicode($str, $s, $l = null) {

return join("", array_slice(

preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $s, $l));

}

$str = "Büyük";

$s = 0; // start from "0" (nth) char

$l = 3; // get "3" chars

echo substr($str, $s, $l) ."\n";

echo mb_substr($str, $s, $l) ."\n";

echo substr_unicode($str, $s, $l);

?>

以上所述就是本文的全部内容了,希望大家能够喜欢。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值