1> "中国".
[20013,22269]
由上可知,我们的中文是以unicode编码的形式存在列表中的,因此,正则匹配只需匹配unicode码即可。
对于unicode编码,我们一般习惯用16进制表示,比如匹配中文的正则表达式为 [\u4e00-\u9fa5],查文档可知,erlang的re模块中,16进制的表示方法\x{hex}, 因此就是 [\x{4e00}-\x{9fff}]。
下面是erlang正则匹配中文的demo
2> re:run("hell
1> "中国".
[20013,22269]
由上可知,我们的中文是以unicode编码的形式存在列表中的,因此,正则匹配只需匹配unicode码即可。
对于unicode编码,我们一般习惯用16进制表示,比如匹配中文的正则表达式为 [\u4e00-\u9fa5],查文档可知,erlang的re模块中,16进制的表示方法\x{hex}, 因此就是 [\x{4e00}-\x{9fff}]。
下面是erlang正则匹配中文的demo
2> re:run("hell