PHP的正则匹配中文一直比较麻烦,要将汉字转化为内码才能匹配得到。这段时间需要用到这方面的东西,但是在网上找不到这方面的资料。所以不得不自己去研究,经过一番摸索。终于实现了特定中文的匹配。 废话少说,直接上代码:
<?PHP
$html="这是汉字";
preg_match_all("/\xba\xba\xd7\xd6/",$html,$match);
print_r($match);
?>
上面的例子匹配了“汉字”两个字。其中每个汉字用两个16进制数表示。至于这两个数字怎么来的。大家可以在这里查到http://ff.163.com/newflyff/gbk-list/
比如“汉”字
大家可以看到他的区码为BA ,位码也是BA
而“字”字
则为d7 d6所以便有了上面的正则