<?php
//提取字符串中的汉字其余信息剔除
header("Content-type: text/html; charset=utf-8");
$str='f龙,真 。,.';
preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str, $matches);
$str = join('', $matches[0]);
echo $str;
?>
PHP利用正则表达式如何匹配出一段字符串中的中文,对于这个问题,网上也有很多代码,但是大部分都存在纰漏,所以下面为大家提供真正能够匹配出中文的代码。分两种编码形式:
1)utf-8的编码格式,匹配中文代码如下:
<?php
$str = "utf-8下匹配出中文字符串";
$preg = "/[\x{4e00}-\x{9fa5}]+/u";
if(preg_match_all($preg,$str,$matches)){
print_r($matches);
}
?>
2)gb2312的编码格式,匹配中文字符串代码如下:
<?php
$str = "gb2312下匹配出中文字符串";
$preg = "/([".chr(0xb0)."-".chr(0xf7)."][".chr(0xa1)."-".chr(0xfe)."])+/i";
if(preg_match($preg,$str,$matches)){
print_r($matches);
}
?>