一、编码范围
1. GBK (GB2312/GB18030)
/x00-/xff GBK双字节编码范围
/x20-/x7f ASCII
/xa1-/xff 中文
/x80-/xff 中文
2. UTF-8 (Unicode)
/u4e00-/u9fa5 (中文)
/x3130-/x318F (韩文
/xAC00-/xD7A3 (韩文)
/u0800-/u4e00 (日文)
ps: 韩文是大于[/u9fa5]的字符
正则例子:
preg_replace("/([/x80-/xff])/","",$str);
preg_replace("/([u4e00-u9fa5])/","",$str);
PHP正则表达式中不支持下列 Perl 转义序列:/L, /l, /N, /P, /p, /U, /u, or /X
在 UTF-8 模式下,允许用“/x{...}”,花括号中的内容是表示十六进制数字的字符串。原来的十六进制转义序列 /xhh 如果其值大于 127 的话则匹配了一个双字节 UTF-8 字符。
二、代码例子