php截取中英文混合字符串,PHP 截取中英文混合字符串的坑

PHP 截取字符串是很常见的操作,日常工作中经常会用到。今天就发生了一件怪事,我做的是im,创建群聊,自动生成默认的群名字,批量拼接成员昵称,然后超过30个字符直接干掉。

最开始的代码如下:

$tempName = substr($tempName,30);

测试一遍,没问题,第二遍,挂了!

97b7fce8bffdc401304a8649b8916858.png

一开始我以为数据库编码问题,我开了utf-8mb4,检查没问题之后,又是看数据库编码,连接数据库配置,重启swoole。还是没找到问题,这时候,我突然想起去年也遇到类似情况。

做水印海报,字符串截取,截取到半个字节的问题。中英文混合的文字,很容易出现这问题。这是因为,计算长度时候,中英文长度是不一样的,要差别处理。

后面,通过分类处理,搞定了这个事情,代码如下,希望能帮助到踩坑的小伙伴。

/**根据字符串,获取临时名字

* @param $tempName

* @return bool|string

*/

public function createTempName($sourcestr, $cutlength=30){

$sourcestr = trim($sourcestr,'、');

$returnstr = '';

$i = 0;

$n = 0;

$str_length = strlen ( $sourcestr ); //字符串的字节数

while ( ($n < $cutlength) and ($i <= $str_length) ) {

$temp_str = substr ( $sourcestr, $i, 1 );

$ascnum = Ord ( $temp_str ); //得到字符串中第$i位字符的ascii码

if ($ascnum >= 224) {//如果ASCII位高与224,

$returnstr = $returnstr . substr ( $sourcestr, $i, 3 ); //根据UTF-8编码规范,将3个连续的字符计为单个字符

$i = $i + 3; //实际Byte计为3

$n ++; //字串长度计1

} elseif ($ascnum >= 192){ //如果ASCII位高与192,

$returnstr = $returnstr . substr ( $sourcestr, $i, 2 ); //根据UTF-8编码规范,将2个连续的字符计为单个字符

$i = $i + 2; //实际Byte计为2

$n ++; //字串长度计1

} elseif ($ascnum >= 65 && $ascnum <= 90) {//如果是大写字母,

$returnstr = $returnstr . substr ( $sourcestr, $i, 1 );

$i = $i + 1; //实际的Byte数仍计1个

$n ++; //但考虑整体美观,大写字母计成一个高位字符

}elseif ($ascnum >= 97 && $ascnum <= 122) {

$returnstr = $returnstr . substr ( $sourcestr, $i, 1 );

$i = $i + 1; //实际的Byte数仍计1个

$n ++; //但考虑整体美观,大写字母计成一个高位字符

} else {//其他情况下,半角标点符号,

$returnstr = $returnstr . substr ( $sourcestr, $i, 1 );

$i = $i + 1;

$n = $n + 0.5;

}

}

return $returnstr;

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值