通常来讲\w我们可以认为是字符类,包括[a-zA-Z0-9],
但是这个不仅限于英文中,我们应当考虑俄语等语言里的字符,也是包括在\w中的,
正则本质上还是能通过字符编码集来实现具体操作的,
在ASCII码中,如果要匹配,则应当使用\x,
而\w其实默认的字符编码集是unicode ,所以应当注意, Dz的用户名注册等没有将此过滤
关于正则的字符编码集可以参考《Steve Mansour 》,下附链接
http://net.pku.edu.cn/~yhf/tutorial/tao_regexps_zh.html