一、中文正则常用
1. 基本匹配
- “()”:匹配小括号内全部内容
- “[]”:匹配方括号内字符
- “[^]”:匹配不含方括号内字符
- “.”:匹配除换行符外的所有字符
- “\d”:匹配数字,等同于[0-9]
- “\D”:匹配非数字,等同于[^\d]
2. 高阶匹配
- “?”:懒惰匹配,仅匹配第一个出现的,默认贪婪匹配
- “(?=)”:正先行断言:匹配出断言前面的内容:([T|t]he)(?=fat)
- “(?!)”:负先行断言:匹配出不在断言前面的内容:([T|t]he)(?!fat)
- “(?<=)”:正后发断言:匹配出断言后面的内容:(?<=[T|t]he)(fat|mat)
- “(?<!)”:负后发断言:匹配出不在断言后面的内容:(?<![T|t]he)(fat|mat)
3. 逻辑语句
- “|”:或
- “\”:转义
4. 限定语句
- “-”:限定范围:[a-z0-9]
- “* ”:限定出现0次及以上:[a-z]*
- “+”:限定出现1次及以上:c.+t
- “?”:限定出现0/1次&#