php trim中文乱码,如何解决php trim 乱码问题

本文探讨了PHP中`rtrim`函数处理多字节字符(如中文)时可能出现的乱码问题,原因是`rtrim`按字节操作而非字符。为了解决这个问题,文章建议使用`mb_rtrim`函数,这是一个多字节安全的版本。文中通过源码分析和示例代码解释了两者的区别,并提供了一个`mb_rtrim`的实现示例。此外,还提醒读者注意PHP中多字节函数和单字节函数的使用场景。
摘要由CSDN通过智能技术生成

php trim乱码是因为在执行rtrim时,会将0x81去掉,导致出现乱码,其解决办法就是通过“mb_rtrim($tag, "、",$encoding)”方法解决乱码即可。

本文操作环境:windows7系统、PHP7.1版,DELL G3电脑

首先运行以下代码:

$tag = "互联网产品、";

$text = rtrim($tag, "、");

print_r($text);

我们可能以为会得到的结果是互联网产品,实际结果是互联网产�。为什么会这样呢?

科普

PHP 里使用mb_前缀的都是多字节函数 http://php.net/manual/zh/ref….

比如

$str = "abcd";

print_r(strlen($str).""); // 4

print_r(mb_strlen($str).""); // 4

$str = "周梦康";

print_r(strlen($str).""); // 9

print_r(mb_strlen($str).""); // 3

mb_系列函数是以“多个字节组成的一个字符”为颗粒度来操作的,不带mb_则是按实际的字节数来操作的。

原理

trim 函数文档

string trim ( string $str [, string $character_mask = " " ] )

该函数不是多字节函数,也就是说,汉字这样的多字节字符,会拿其头或尾的单字节来和后面的$character_mask对应的char数组进行匹配,如果在后面的数组中,则删掉,继续匹配。比如:

echo ltrim("bcdf","abc"); // df

如下面的 demo 中的函数string_print_char所示:

、由0xe3 0x80 0x81三字节组成,

品由0xe5 0x93 0x81三字节组成。

所以在执行rtrim的时候,通过字节比对,会将0x81去掉,导致了最后出现了乱码。

【推荐学习:《PHP视频教程》】

源码探究

查看 PHP7 的源码,然后提炼出下面的小 demo ,方便大家一起学习,其实PHP源码的学习并不难,每天进步一点点。

//

// main.c

// trim

//

// Created by 周梦康 on 2017/10/18.

// Copyright © 2017年 周梦康. All rights reserved.

//

#include

#include

#include

void string_print_char(char *str);

void php_charmask(unsigned char *input, size_t len, char *mask);

char *ltrim(char *str,char *character_mask);

char *rtrim(char *str,char *character_mask);

int main(int argc, char const *argv[])

{

printf("%s",ltrim("bcdf","abc"));

string_print_char("品"); // e5 93 81

string_print_char("、"); // e3 80 81

printf("%s",rtrim("互联网产品、","、"));

return 0;

}

char *ltrim(char *str,char *character_mask)

{

char *res;

char mask[256];

register size_t i;

int trimmed = 0;

size_t len = strlen(str);

php_charmask((unsigned char*)character_mask, strlen(character_mask), mask);

for (i = 0; i < len; i++) {

if (mask[(unsigned char)str[i]]) {

trimmed++;

} else {

break;

}

}

len -= trimmed;

str += trimmed;

res = (char *) malloc(sizeof(char) * (len+1));

memcpy(res,str,len);

return res;

}

char *rtrim(char *str,char *character_mask)

{

char *res;

char mask[256];

register size_t i;

size_t len = strlen(str);

php_charmask((unsigned char*)character_mask, strlen(character_mask), mask);

if (len > 0) {

i = len - 1;

do {

if (mask[(unsigned char)str[i]]) {

len--;

} else {

break;

}

} while (i-- != 0);

}

res = (char *) malloc(sizeof(char) * (len+1));

memcpy(res,str,len);

return res;

}

void string_print_char(char *str)

{

unsigned long l = strlen(str);

for (int i=0; i < l; i++) {

printf("%02hhx ",str[i]);

}

printf("");

}

void php_charmask(unsigned char *input, size_t len, char *mask)

{

unsigned char *end;

unsigned char c;

memset(mask, 0, 256);

for (end = input+len; input < end; input++) {

c = *input;

mask[c]= 1;

}

}

如果觉得 demo 还不够清晰的,复制下来,自己执行一次吧~

C 语言基础较差的同学也不用担心,我准备后面专门写一个PHP小白学习 C 语言的系列入门短文哈。

解决方案

那么我们就依葫芦画瓢,用 php 本身的多字节函数来实现下吧:

function mb_rtrim($string, $trim, $encoding)

{

$mask = [];

$trimLength = mb_strlen($trim, $encoding);

for ($i = 0; $i < $trimLength; $i++) {

$item = mb_substr($trim, $i, 1, $encoding);

$mask[] = $item;

}

$len = mb_strlen($string, $encoding);

if ($len > 0) {

$i = $len - 1;

do {

$item = mb_substr($string, $i, 1, $encoding);

if (in_array($item, $mask)) {

$len--;

} else {

break;

}

} while ($i-- != 0);

}

return mb_substr($string, 0, $len, $encoding);

}

mb_internal_encoding("UTF-8");

$tag = "互联网产品、";

$encoding = mb_internal_encoding();

print_r(mb_rtrim($tag, "、",$encoding));

当然你也可以使用正则来做。通过上面的函数学习,单字节函数和多字节函数,你学会了吗?

PHP7 相关源码

PHP_FUNCTION(trim)

{

php_do_trim(INTERNAL_FUNCTION_PARAM_PASSTHRU, 3);

}

PHP_FUNCTION(rtrim)

{

php_do_trim(INTERNAL_FUNCTION_PARAM_PASSTHRU, 2);

}

PHP_FUNCTION(ltrim)

{

php_do_trim(INTERNAL_FUNCTION_PARAM_PASSTHRU, 1);

}

static void php_do_trim(INTERNAL_FUNCTION_PARAMETERS, int mode)

{

zend_string *str;

zend_string *what = NULL;

ZEND_PARSE_PARAMETERS_START(1, 2)

Z_PARAM_STR(str)

Z_PARAM_OPTIONAL

Z_PARAM_STR(what)

ZEND_PARSE_PARAMETERS_END();

ZVAL_STR(return_value, php_trim(str, (what ? ZSTR_VAL(what) : NULL), (what ? ZSTR_LEN(what) : 0), mode));

}

PHP

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值