PHP 截取字符串是很常见的操作,日常工作中经常会用到。今天就发生了一件怪事,我做的是im,创建群聊,自动生成默认的群名字,批量拼接成员昵称,然后超过30个字符直接干掉。
最开始的代码如下:
$tempName = substr($tempName,30);
测试一遍,没问题,第二遍,挂了!
一开始我以为数据库编码问题,我开了utf-8mb4,检查没问题之后,又是看数据库编码,连接数据库配置,重启swoole。还是没找到问题,这时候,我突然想起去年也遇到类似情况。
做水印海报,字符串截取,截取到半个字节的问题。中英文混合的文字,很容易出现这问题。这是因为,计算长度时候,中英文长度是不一样的,要差别处理。
后面,通过分类处理,搞定了这个事情,代码如下,希望能帮助到踩坑的小伙伴。
/**根据字符串,获取临时名字
* @param $tempName
* @return bool|string
*/
public function createTempName($sourcestr, $cutlength=30){
$sourcestr = trim($sourcestr,'、');
$returnstr = '';
$i = 0;
$n = 0;
$str_length = strlen ( $sourcestr ); //字符串的字节数
while ( ($n < $cutlength) and ($i <= $str_length) ) {
$temp_str = substr ( $sourcestr, $i, 1 );
$ascnum = Ord ( $temp_str ); //得到字符串中第$i位字符的ascii码
if ($ascnum >= 224) {//如果ASCII位高与224,
$returnstr = $returnstr . substr ( $sourcestr, $i, 3 ); //根据UTF-8编码规范,将3个连续的字符计为单个字符
$i = $i + 3; //实际Byte计为3
$n ++; //字串长度计1
} elseif ($ascnum >= 192){ //如果ASCII位高与192,
$returnstr = $returnstr . substr ( $sourcestr, $i, 2 ); //根据UTF-8编码规范,将2个连续的字符计为单个字符
$i = $i + 2; //实际Byte计为2
$n ++; //字串长度计1
} elseif ($ascnum >= 65 && $ascnum <= 90) {//如果是大写字母,
$returnstr = $returnstr . substr ( $sourcestr, $i, 1 );
$i = $i + 1; //实际的Byte数仍计1个
$n ++; //但考虑整体美观,大写字母计成一个高位字符
}elseif ($ascnum >= 97 && $ascnum <= 122) {
$returnstr = $returnstr . substr ( $sourcestr, $i, 1 );
$i = $i + 1; //实际的Byte数仍计1个
$n ++; //但考虑整体美观,大写字母计成一个高位字符
} else {//其他情况下,半角标点符号,
$returnstr = $returnstr . substr ( $sourcestr, $i, 1 );
$i = $i + 1;
$n = $n + 0.5;
}
}
return $returnstr;
}