原子
原子指正则表达式中不可再分的基本单元。
如:php p 等
注意:原子能不能再分,是相对于需求而言的!!
可见原子
普通字符 | 字母 数字汉字符号空格… |
特殊字符 | / \ . * ? “' | [] () {} |
注意:“汉字”建议使用Unicode编码再进行匹配在线转码工具:http://tool.chinaz.com/tools/unicode.aspx
不可见原子
\t | 制表符(tab) |
\n | 换行字符(回车) |
自定义原子
[abc] | 只匹配其中的一个原子 |
[^abc] | 只匹配"除了"其中字符的任意一个原子 |
[0-9] | 匹配0-9任何一个数字 |
[a-z] | 匹配小写a-z任何一个字母 |
[A-Z] | 匹配大写A-Z任何一个字母 |
通用字符类型作原子
\d | 匹配任意一个数字 | [0-9] |
\D | 匹配任意一个非数字 | [^0-9] |
\w | 匹配任意一个数字字母下划线 | [0-9a-zA-Z_] |
\W | 匹配任意一个非数字字母下划线 | [^0-9a-zA-Z_] |
\s | 匹配任意一个空白字符 | [\n\f\r\t\v] |
元字符
元字符就是指那些在正则表达式中具有特殊意义的专用字符
. | 匹配除换行以外的任意字符 |
| | 匹配多个分支选择 |