PHP中文文字正则替换，并将需要处理的中文做处理（符号代替、unicode编码、翻译等等操作）

最新推荐文章于 2024-05-28 11:01:49 发布

追梦赤子心刘大哥

最新推荐文章于 2024-05-28 11:01:49 发布

阅读量1.7k

点赞数

分类专栏： php 文章标签： php 深度函数使用正则 unicode编码

本文链接：https://blog.csdn.net/qq_37035946/article/details/84940680

版权

php 专栏收录该内容

53 篇文章 0 订阅

订阅专栏

笔记：工作中遇到一个问题，状况是将前端写好的邮件模板存入数据库，由于邮件模板中带有中文汉字，需求是将中文通过unicode（）转化为前端易于展示的十进制的unicode（&#+数字），而后端常常用十六进制的unicode（\u+）,思路一开始能想到就是正则去匹配然后将结果拼起来。后来通过百度和自己去php官网的延伸找到了办法，先贴代码

preg_replace只能做到查找字符串并替换，做不到单独对每一个匹配到的中文做处理，所以需要一个回调也就是preg_replace_callback

$content = preg_replace_callback('#(?:(?![，。？])[\xC0-\xFF][\x80-\xBF]+)+#','unicode_encode',$content);//$content是需要处理的字符串

function unicode_encode($str, $encoding = 'UTF-8', $prefix = '&#', $postfix = ';'){
    if (is_array($str)) $str = implode(',',$str);
    $str = iconv($encoding, 'UCS-2BE', $str);       //param1  输入的编码格式    param2 输出的编码格式  windows输出格式UCS-2或者UCS-2BE都可以，linux默认UCS-2BE,不加BE还是会乱码
    $arrstr = str_split($str, 2);
    $unistr = '';
    for($i = 0, $len = count($arrstr); $i < $len; $i++) {
        $dec = hexdec(bin2hex($arrstr[$i]));
        $unistr .= $prefix . $dec . $postfix;
    }
    return $unistr;
}

$content = stripslashes(str_replace(array('\r\n', '\r', '\n'), "", $content)); //遇到we're  处理后会变成 we\\\'re  ，所以需要函数处理。

这样之后就可以将文本中所有的中文做unicode处理。由于我使用preg_replace_callback（）的第一个参数正则里只有一个括号，也就是后向引用只有一个匹配值（一维数组）,所以没有去取其他的匹配值。见仁见智。附带官网 example#2：

范例 ¶

Example #2 preg_replace_callback()示例

<?php // 将文本中的年份增加一年. $text = "April fools day is 04/01/2002\n"; $text.= "Last christmas was 12/24/2001\n"; // 回调函数 function next_year($matches) { // 通常: $matches[0]是完成的匹配 // $matches[1]是第一个捕获子组的匹配 // 以此类推 return $matches[1].($matches[2]+1); } echo preg_replace_callback( "|(\d{2}/\d{2}/)(\d{4})|", "next_year", $text); ?>

追梦赤子心刘大哥

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
PHP中文文字正则替换，并将需要处理的中文做处理（符号代替、unicode编码、翻译等等操作）

笔记：工作中遇到一个问题，状况是将前端写好的邮件模板存入数据库，由于邮件模板中带有中文汉字，需求是将中文通过unicode（）转化为前端易于展示的十进制的unicode（&amp;#+数字），而后端常常用十六进制的unicode（\u+）,思路一开始能想到就是正则去匹配然后将结果拼起来。后来通过百度和自己去php官网的延伸找到了办法，先贴代码preg_replace只能做到查找字符串并替换，...
复制链接

扫一扫