1、正则当中的名词解释
- 元字符
指哪些在正则表达式中具有特殊意义的专用字符,如: 点(.),星(*),问号(?)
等 - 前导字符
位于元字符前面的字符,abc
* aooo
.
2、第一类正则表达式
2.1 正则中普通常用的元字符
元字符 | 功能 | 备注 |
---|
. | 匹配除了换行符以外的任意单个字符 | |
* | 前导字符出现0次或连续多次 | |
.* | 任意长度字符 | ab.* |
^ | 行首(以…开头) | ^root |
$ | 行尾(以…结尾) | bash$ |
^$ | 空行 | |
[] | 匹配括号里任意单个字符或一组单个字符 | [abc] |
[^] | 匹配不包含括号里任一单个字符或一组单个字符 | [^abc] |
^[] | 匹配以括号里任意单个字符或一组单个字符开头 | ^[abc] |
^[^] | 匹配不以括号里任意单个字符或一组单个字符开头 | ^[^abc] |
2.2 正则中其他常用元字符
元字符 | 功能 | 备注 |
---|
\< | 取单词的头 | |
\> | 取单词的尾 | |
\< \> | 精确匹配 | |
\{ n\} | 匹配前导字符连续出现n次 | |
\{n,\} | 匹配前导字符至少出现n次 | |
\{n,m\} | 匹配前导字符出现n次与m次之间 | |
\( \) | 保存被匹配的字符 | |
\d | 匹配数字(grep -P) | [0-9] |
\w | 匹配字母数字下划线(grep -P) | [a-zA-Z0-9] |
\s | 匹配空格、制表符、换页符(grep -P) | [\t\r\n] |
2.3 扩展类正则常用元字符
- grep 要用扩展正则必须要加选项 -E,或者直接使用egrep
- sed要使用扩展正则必须要加选项 -r
扩展元字符 | 功能 | 备注 |
---|
+ | 匹配一个或多个前导字符 | bo+匹配boo、bo |
? | 匹配零个或一个前导字符 | bo?匹配b、bo |
| | 或 |
() | 组字符(看成整体) | (my|your)self:表示匹配myself或匹配yourself |
{n} | 前导字符重复n次 | |
{n, } | 前导字符重复至少n次 | |
{n,m} | 前导字符重复n到m次 | |
3、第二类正则
表达式 | 功能 | 示例 |
---|
[:alnum:] | 字母与数字字符 | [[:alnum:]]+ |
[:alpha:] | 字母字符(包括大小写字母) | [[:alpha:]]{4} |
[:blank:] | 空格与制表符 | [:blank:]]* |
[:digit:] | 数字 | [:digit:]? |
[:lower:] | 小写字母 | [[:lower:]{4,} |
[:upper:] | 大写字母 | [[:upper:]]+ |
[:punct:] | 标点符号 | [:punct:]] |
[:space:] | 包括换行符,回车等在内的所有空白 | [:space:]]+ |
4、案例
1、查找不以大写字母开头的行(三种写法)
grep '^[^A-Z]' 1.txt
grep -v '^[A-Z]' 1.txt
grep '^[^[:upper:]]' 1.txt
2、查找有数字的行(两种写法)
grep '[0-9]' 1.txt
grep -P '\d' 1.txt
3、查找一个数字和字母连起来的行
grep -E '[0-9][a-zA-Z]|[a-zA-Z][0-9]' 1.txt
4、查找不以r开头的行
grep -v '^r' 1.txt
grep '^[^r]' 1.txt
5、查找以数字开头的行
grep '^[0-9]' 1.txt
6、查找以大写字母开头的行
grep '^[A-Z]' 1.txt
7、查找以小写字母开头的行
grep '^[a-z]' 1.txt
8、查找以点结束的行
grep '\.$' 1.txt
9、去掉空行
grep -v '^$' 1.txt
10、查找完全匹配abc的行
grep -w 'abc' 1.txt
grep '\<abc\>' 1.txt
11、查找A后有三个数字的行
grep -E 'A[0-9]{3}'
12、统计root在/etc/passwd里出现了几次
grep -o 'root' 2.txt | wc =l
13、用正则表达式找出自己的IP地址、广播地址、子网掩码
ifconfig eth0 | grep -E -o '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}'
ifconfig eth0 | grep -E -o '([0-9]{1,3}\.){3}[0-9]{1,3}'
ifconfig eth0 | grep -P -o '\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}'
ifconfig eth0 | grep -P -o '(\d{1,3}\.){3}[0-9]{1,3}'
ifconfig eth0 | grep -P -o '(\d+\.){3}\d+'
14、找出全部是数字的行
grep -E '^[0-9]+$' 1.txt
15、找出邮箱地址
grep -E '^[0-9a-zA-Z]+@[a-z0-9]+\.[a-z]+$'