代码片段-PHP-UTF8中文字符截断

今天需要用一个UTF-8的字符串截断函数,网上找了几个代码片段发现都有问题,于是查了一下原理自己写了一个函数,代码片段如下:

View Code
 1 <?php
 2 /* UTF-8中文字符截断程序 */
 3 
 4 
 5 $str = "123这是测试字符串";
 6 $str1 = "()()";
 7 echo subUTF8str($str,0,3)."<br>";
 8 echo subUTF8str($str,0,4)."<br>";
 9 echo subUTF8str($str1,0,4)."<br>";
10 echo subUTF8str($str1,0,10)."<br>";
11 
12 function subUTF8str($str,$start=0,$length=80){ 
13    $cur_len = 0; //人理解的字符串长度
14    $all_len = strlen($str); //机器理解字符串长度
15    if($length > $all_len)
16    {
17         return $str;
18    }
19    for($i = 0;$i < $all_len;)
20    {
21         if($cur_len == $start)
22         {
23             break;
24         }
25         if (ord($str[$i]) > 127)
26         {
27             $i += 3;
28         }else{
29             $i += 1;
30         }
31         $cur_len ++;
32    }
33     $start_pos = $i;
34     $temp_pos = $cur_len;
35     for(;$cur_len - $temp_pos < $length;)
36     {
37         if($i >= $all_len)
38             break;
39         if (ord($str[$i]) > 127)
40         {
41             $i += 3;
42         }else{
43             $i += 1;
44         }
45         $cur_len ++;
46     }
47     $end_pos = $i;
48     return substr($str,$start_pos,$end_pos);
49 } 
50 ?>

其实,PHP原生就有多charset下字符截取方案,额,所以就是这个样子...囧..

Multibyte String Functions函数族中,

string mb_substr ( string $str , int $start [, int $length [, string $encoding ]] )  用来字符串截取

int mb_strlen ( string $str [, string $encoding ] )  返回字符串长度

....

详细请查看PHP手册

转载于:https://www.cnblogs.com/rppig/archive/2012/09/10/2678925.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值