php截取字符串utf8,php截取字符串之截取utf8或gbk编码的中英文字符串示例

最新推荐文章于 2021-03-29 02:35:17 发布

guyu0908

最新推荐文章于 2021-03-29 02:35:17 发布

阅读量114

点赞数

文章标签： php截取字符串utf8

"该博客介绍了一个针对微博字数限制的PHP函数strlen_weibo()，它能正确计算中文、英文、全角和半角字符的计数。函数考虑了UTF-8编码下中文占用的字节数，并按微博的特殊规则进行计数，例如字母算1，全角字符算2，半角字符算1，中文也计为2。测试案例显示，如字符串$s="s＠@你好"，输出结果为8。"

摘要由CSDN通过智能技术生成

微博的发言有字数限制，其计数方式是，中文算2个，英文算1个，全角字符算2个，半角字符算1个。

php中自带strlen是返回的字节数，对于utf8编码的中文返回时3个，不满足需求。

mb_strlen 可以根据字符集计算长度，比如utf8的中文计数为1，但这不符合微博字数限制需求，中文必须计算为2才可以。

google了下，找到一个discuz中截取各种编码字符的类，改造了下，已经测试通过.其中参数$charset 只支持gbk与utf-8。

$a = "s＠@你好";

var_dump(strlen_weibo($a,'utf-8'));

结果输出为8，其中字母s计数为1，全角＠计数为2，半角@计数为1，两个中文计数为4。源码如下：

function strlen_weibo($string, $charset='utf-8')

{

$n = $count = 0;

$length = strlen($string);

if (strtolower($charset) == 'utf-8')

{

while ($n < $length)

{

$currentByte = ord($string[$n]);

if ($currentByte == 9 ||

$currentByte == 10 ||

(32 <= $currentByte && $currentByte <= 126))

{

$n++;

$count++;

} elseif (194 <= $currentByte && $currentByte <= 223)

{

$n += 2;

$count += 2;

} elseif (224 <= $currentByte && $currentByte <= 239)

{

$n += 3;

$count += 2;

} elseif (240 <= $currentByte && $currentByte <= 247)

{

$n += 4;

$count += 2;

} elseif (248 <= $currentByte && $currentByte <= 251)

{

$n += 5;

$count += 2;

} elseif ($currentByte == 252 || $currentByte == 253)

{

$n += 6;

$count += 2;

} else

{

$n++;

$count++;

}

if ($count >= $length)

{

break;

}

}

return $count;

} else

{

for ($i = 0; $i < $length; $i++)

{

if (ord($string[$i]) > 127)

{

$i++;

$count++;

}

$count++;

}

return $count;

}

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
php截取字符串utf8,php截取字符串之截取utf8或gbk编码的中英文字符串示例

微博的发言有字数限制，其计数方式是，中文算2个，英文算1个，全角字符算2个，半角字符算1个。php中自带strlen是返回的字节数，对于utf8编码的中文返回时3个，不满足需求。mb_strlen 可以根据字符集计算长度，比如utf8的中文计数为1，但这不符合微博字数限制需求，中文必须计算为2才可以。google了下，找到一个discuz中截取各种编码字符的类，改造了下，已经测试通过.其中参数$c...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。