iamlaosong文
网上提供的Email地址验证的正则表达式是:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
表达式中比较难以理解的就是其中的[-+.],尤其是其中的加号,因为正则表达式中“+”是有特殊含义的,表示前面的规则至少匹配一次。但中括号中的“+”就是其本身的含义,[-+.]的意思就是其中减号、加号和点任意一个都可以作为用户名中分隔符,([-+.]\w+)*中的“*”表示这一部分可有可无,可以重复多次。按照这个验证规则,Email地址中用户名部分如abc.def、abc.def.ghk、abc-def.ghk、abc.def+ghk-qwe都应该是合法的,虽然日常生活中很少这样用,尤其是没有见过用户名中含有“+”号的。
E-mail 地址格式标准有两种:
一种是常规标准,诞生于1982年,也是现在绝大多数服务器使用的标准,只能使用字母、数字、下划线。
另一种标准是在2008年发布的,主要有三个核心标准:RFC5335、RFC5336和RFC5337。其作用旨在实现邮件地址的国际化。国际化系列标准的推出使世界各国人民用上自己母语的电子邮件地址成为可能。各种有形字符(@除外)都可以使用。
按照日常的Email地址情况,这个验证规则完全可以严格一点,把那些奇葩的地址滤掉:
^\w+([-.]\w+)*@\w+([-.]\w+)*\.\w{2,6}$