一、需求
PHP preg_replace,替换省、市、区为空
二、实现
1、使用表达式["省","市","自治州","自治区"],出现了乱码
$text = "浙江省";
$pattern = '/["省","市","自治州","自治区"]/';
$replacement = '';
$result = preg_replace($pattern, $replacement, $text);
echo $result;exit;
2、因为是汉字,1表达式的基础上添加/u
修饰符(表示使用 Unicode 编码),这样就不会乱码了;
$text = "浙江省";
$pattern = '/["省","市","自治州","自治区"]/u';
$replacement = '';
$result = preg_replace($pattern, $replacement, $text);
echo $result;exit;
3、低版本php,不支持/u修饰符,可以换成正则表达式(省|市|区),无需添加/u修饰符,即可成功替换。
$text = "浙江省";
$pattern = '/(省|市|区)/';
// $pattern = '/["省","市","自治州","自治区"]/u';
$replacement = '';
$result = preg_replace($pattern, $replacement, $text);
echo $result;exit;
4、可以不是用正则替换,改为str_replace替换哦
$text = "浙江省";
// $pattern = '/["省","市","自治州","自治区"]/u';
$replacement = '';
// $result = preg_replace($pattern, $replacement, $text);
$result = str_replace(["省","市","自治州","自治区"],$replacement,$text);
echo $result;exit;
三、总结
1、中文汉字、中文字符匹配出现乱码,只针对["省","市","自治州","自治区"]表达式,需要添加/u修饰符,才不会乱码(php高版本支持);
其他表达式,比如(省|市|区),可以随意匹配,不会出现中文乱码。
2、可以使用str_replace代替preg_replace
3、在 PHP 中,使用 u
修饰符允许正则表达式处理 Unicode 字符。这个修饰符告诉 PHP 引擎将模式和目标字符串视为 UTF-8 编码的字符序列,以便正确处理 Unicode 字符。
u
修饰符最早是在 PHP 4.1.0 版本中引入的,并且需要 PHP 在 4.2.3 版本或更高版本的环境中才能正常工作。因此,如果您使用的是 PHP 4.2.3 或更高版本,您就可以放心地在正则表达式中使用 u
修饰符来处理 Unicode 字符。
例如,在处理中文字符时,特别是需要匹配中文字符范围内的内容时,使用 u
修饰符非常有用。