php实现中文截取无乱码的方法,php中文截取无乱码函数

本文探讨了在PHP中使用substr函数截取中文字符串时出现的乱码问题,由于substr按字节处理,导致中文字符无法正确截取。解决方案是使用mb_strlen和mb_substr这两个多字节字符串处理函数,它们能正确处理UTF-8编码的中文字符。在使用这些函数前,需要确保PHP开启mbstring扩展。
摘要由CSDN通过智能技术生成

41bf49f999db5fe3fbb7080f06376e39.png

在PHP中经常使用substr来进行字符串的截取,但是当我们用它来实现对中文字符进行截取的时候则会发生乱码问题,比如说:<?php

$mystring="今天天气真好";

$mysubstring=substr($mystring,0,2);

echo $mysubstring;

?>

输出结果为�;(推荐学习:PHP编程从入门到精通)

原因分析:substr函数原型为:string substr ( string $string , int $start [, int $length ] ),其中$length表示返回字节长度,而一个中文占两个字节,对于一个UTF-8的中文字符,会把它当做3个字节来处理。<?php

$length=strlen($mystring);echo $length;//输出结果为18

?>

就是说我们可以用令$length为3,这样就会成功返回一个“今”字。这样的话如果中文和英文混杂的话则需要我们好好地计算一下$length了。

那么有更好的解决办法吗?Php给出了另外的函数mb_strlen和mb_substr<?php

$length=mb_strlen($mystring);

$mysub=mb_substr($mystring,0,4);

echo "the length is:$length,","the substr is:$mysub";

?>

输出结果为:the length is:6,the substr is:今天天气

mb_strlen函数原型为int mb_strlen(string string_input, string encode);encode默认为UTF-8,它会将为UTF-8编码的中文字符算作一个

注意:mb_strlen与mb_substr并不是PHP的核心函数,使用前需要打开php.ini中的extension=php_mbstring.dll这一项

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值