PHP preg_replace正则表达式涉及汉字乱码

一、需求

PHP preg_replace,替换省、市、区为空

二、实现

1、使用表达式["省","市","自治州","自治区"],出现了乱码

        $text = "浙江省";
        $pattern = '/["省","市","自治州","自治区"]/';
        $replacement = '';
        $result = preg_replace($pattern, $replacement, $text);
        echo $result;exit;

2、因为是汉字,1表达式的基础上添加/u 修饰符(表示使用 Unicode 编码),这样就不会乱码了;

        $text = "浙江省";
        $pattern = '/["省","市","自治州","自治区"]/u';
        $replacement = '';
        $result = preg_replace($pattern, $replacement, $text);
        echo $result;exit;

3、低版本php,不支持/u修饰符,可以换成正则表达式(省|市|区),无需添加/u修饰符,即可成功替换。

        $text = "浙江省";
        $pattern = '/(省|市|区)/';
//        $pattern = '/["省","市","自治州","自治区"]/u';
        $replacement = '';
        $result = preg_replace($pattern, $replacement, $text);
        echo $result;exit;

4、可以不是用正则替换,改为str_replace替换哦

        $text = "浙江省";
//        $pattern = '/["省","市","自治州","自治区"]/u';
        $replacement = '';
//        $result = preg_replace($pattern, $replacement, $text);
        $result = str_replace(["省","市","自治州","自治区"],$replacement,$text);
        echo $result;exit;

三、总结

1、中文汉字、中文字符匹配出现乱码,只针对["省","市","自治州","自治区"]表达式,需要添加/u修饰符,才不会乱码(php高版本支持);
其他表达式,比如(省|市|区),可以随意匹配,不会出现中文乱码。

2、可以使用str_replace代替preg_replace

3、在 PHP 中,使用 u 修饰符允许正则表达式处理 Unicode 字符。这个修饰符告诉 PHP 引擎将模式和目标字符串视为 UTF-8 编码的字符序列,以便正确处理 Unicode 字符。

u 修饰符最早是在 PHP 4.1.0 版本中引入的,并且需要 PHP 在 4.2.3 版本或更高版本的环境中才能正常工作。因此,如果您使用的是 PHP 4.2.3 或更高版本,您就可以放心地在正则表达式中使用 u 修饰符来处理 Unicode 字符。

例如,在处理中文字符时,特别是需要匹配中文字符范围内的内容时,使用 u 修饰符非常有用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值