大家应该都很了解这里就不具体细说了。
string mb_substr ( string $str
, int $start
[, int $length
[, string $encoding
]] )
参数:$string 要截取的字符串。
$start 截取的开始位置。注意:第一个字符的位置是0,以此类推。
$length 这是要截取的字符的长度,注意不是结束的位置。这就是 strlen($string) 、strlen($string)-1的区别哦。
$encoding 截取后的字符串编码。一般常用的都是utf-8.
主要作用:
就是防止截取汉字字符串时乱码。mb_substr是按字来切分字符,不是按照字节切割。
注意:
1、$length 参数,上面我提到过,是长度,不是位置,这里会有一个”坑“。
正确的写法是
mb_substr ($str
,0 ,strlen($str), 'utf-8');
错误的写法,有时结果也是对的,我们看下面代码
$target_1 = '3c6d55fbb2fb431669167c3a20a4462309f7d360.jpg';
$target_2 = '3c6d55fbb2fb431669167c3a20a4462309f7d360和.jpg';
echo mb_substr($target_1,0,mb_strlen($target_1)-1, 'UTF-8') . "<br>";
echo mb_substr($target_2,0,mb_strlen($target_2)-1, 'UTF-8');
结果:
由此可见,当字符串中含有汉字时,错误的写法也会得到正确的结果。究其原因呢,就是一个汉字按两个或者三个字符(编码不同)计算的。
尤其是在处理汉字乱码时应特别注意。