正则表达式
正则表达式:用于匹配文件内容
通配符:用于匹配文件位置
正则表达式基本语法:
一个正则表达式通常被称为一个模式(pattern),为用来描述或者匹配一系列符合某个句法规则的字符串。
- 选择
|
竖直分隔符表示选择 相当于 or(两者中选择一个)
- 数量限定
+
表示前面的字符必须出现至少一次(1次或多次)
?
表示前面的字符最多出现一次(0次或1次)
*
代表前面的字出现0次或者多
- 范围和优先级
()
将括号内的模式串作为一个整体
- 语法(部分)
字符 | 描述 |
---|---|
\ | 将下一个字符标记为一个特殊字符、或一个原义字符 |
^ | 匹配输入字符串的开始位置。 |
$ | 匹配输入字符串的结束位置。 |
{n} | n是一个非负整数。匹配确定的n次 |
{n,} | n是一个非负整数。至少匹配n次 |
{n,m} | 最少匹配n次且最多匹配m次 |
. | 匹配除“\n”之外的任何单个字符 |
x|y | 匹配x或y |
[xyz] | 匹配所包含的任意一个字符 |
[^xyz] | 匹配未列出的任意字符。 |
[a-z] | 匹配指定范围内的任意字符 |
[^a-z] | 匹配任何不在指定范围内的任意字符 |
- 优先级(降序):
运算符 | 说明 |
---|---|
\ | 转义符 |
(), [] | 括号和中括号 |
*、+、?、{n}、{n,}、{n,m} | 限定符 |
^、$、\ | 任何元字符 定位点和序列 |
| | 选择 |
- 常用的正则表达式:
表达式 | 说明 |
---|---|
[\(|(].*?[\)|)] | 匹配中文或者西文括号及其括号中的内容 |
^[0-9]*$ | 数字 |
^\d{n}$ | n位的数字 |
^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$ | Email地址 |
^(13[0-9]|14[5|7]|15[0|1|2|3|4|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$ | 手机号码 |
(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$) | 身份证号(15位、18位数字),最后一位是校验位,可能为数字或字符X |
- 后记:
有需要的朋友可以搜索微信公众号:【知音库】
这里有个人总结的文章,本人是大数据专业学生,
同时也是为了鼓励自己,坚持写笔记,希望可以共同进步。