php根据单词截取英文语句,可以保证单词完整性的PHP英文字符串截取代码分享

这段代码提供了一个优化的UTF8字符串截取方法,考虑了字符边界问题,确保截取的字符串不会出现残缺的多字节字符。它首先使用PHP内置的`substr`函数进行初步截取,然后检查头尾部分的6个字节,根据UTF8编码规则判断是否完整。如果发现不完整,会进一步调整截取范围。最后,如果截取的字符串长度小于原字符串,会在末尾添加省略号。
摘要由CSDN通过智能技术生成

直接上代码:

/**

* 完整词的截取

*

* @param $str

* @param $start

* @param $length

*

* @return string

*/

public static function usubstr($str, $start, $length = null)

{

// 先正常截取一遍.

$res = substr($str, $start, $length);

$strlen = strlen($str);

/* 接着判断头尾各6字节是否完整(不残缺) */

// 如果参数start是正数

if ($start >= 0) {

// 往前再截取大约6字节

$next_start = $start + $length; // 初始位置

$next_len = $next_start + 6 <= $strlen ? 6 : $strlen - $next_start;

$next_segm = substr($str, $next_start, $next_len);

// 如果第1字节就不是 完整字符的首字节, 再往后截取大约6字节

$prev_start = $start - 6 > 0 ? $start - 6 : 0;

$prev_segm = substr($str, $prev_start, $start - $prev_start);

} // start是负数

else {

// 往前再截取大约6字节

$next_start = $strlen + $start + $length; // 初始位置

$next_len = $next_start + 6 <= $strlen ? 6 : $strlen - $next_start;

$next_segm = substr($str, $next_start, $next_len);

// 如果第1字节就不是 完整字符的首字节, 再往后截取大约6字节.

$start = $strlen + $start;

$prev_start = $start - 6 > 0 ? $start - 6 : 0;

$prev_segm = substr($str, $prev_start, $start - $prev_start);

}

// 判断前6字节是否符合utf8规则

if (preg_match('@^([x80-xbf]{0,5})[xc0-xfd]?@', $next_segm, $bytes)) {

if (!empty($bytes[1])) {

$bytes = $bytes[1];

$res .= $bytes;

}

}

// 判断后6字节是否符合utf8规则

$ord0 = ord($res[0]);

if (128 <= $ord0 && 191 >= $ord0) {

// 往后截取 , 并加在res的前面.

if (preg_match('@[xc0-xfd][x80-xbf]{0,5}$@', $prev_segm, $bytes)) {

if (!empty($bytes[0])) {

$bytes = $bytes[0];

$res = $bytes . $res;

}

}

}

if (strlen($res) < $strlen) {

$res = $res . '...';

}

return $res;

}

希望与广大网友互动??

点此进行留言吧!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值