一、概念
字符串是计算机应用中最广泛的处理对象之一(网页,文档),并且字符串组合规则形式多样,比如
1 数字字符串2 C 语言标识符3 IP 地址字符串4 URL 字符串 ( 统一资源定位符 )5 。。。
上面这些都是我们程序设计需要处理的对象,现在的问题是:计算机要处理这些字符串,首先需要某种语言去描述这些字符串的规则,也就是我们所说的正则表达式,它是描述某一特定规则的表达式。
1 [ 0 - 9 ] + 代表数字
二、正则表达式的字符组成
正则表达式是由一些字符去描述规则,在正则表达式中有两类字符
(1)元字符(Meta Character):不代表自己,代表某个特定的字符或多个字符
(2)普通字符:仅代表自身的字符. \元字符 ==> 普通字符
三、正则表达式的流派
正则表达式有不同的流派(Egrep,java,C#)很多语言都用到了正则表达式,但是这些语言中用来描述字符串规则的"元字符"不是都一样的,我们称正则表达式有不同的流派。
四、元字符
元字符(Meta Character):不代表自己,代表某个特定的字符或多个字符
![](https://img-blog.csdnimg.cn/b1dd3ff1f39744c1a8edf2845ca50dfc.png)
练习:用正则表达式描述IPV4的网络地址
1 asdsdss192 . a . 65.4 ddgdgsgsfdg 123 adsad 123 sa 676761234 safd192 . 168.63.100 fed2 987685 dfgfdgf192 . 168.63.1 dsabcd245345456 abcdefg
1 ([0-9]{1,3}\.){3}[0-9]{1,3}
五、grep命令
(Global search Regular Expression and Print out the line的简称,即全面搜索正则表达式并把行打印出来)
grep(egrep):用来在文本文件里查一个特定的字符串,
egrep用的是扩展的正则表达式
![](https://img-blog.csdnimg.cn/e4ea9a9a9e914d5f931346f60a8ea392.png)
注意:
1)默认情况下,grep命令打印出包含模式的所有行,一旦加上-c选项,就只显示包含模式行的数量
eg:
1 grep - n - E -- color = always - H "([0-9]{1,3}.){3}[0-9]{1,3}" 1. txt
练习: 查找1.txt 里的大于1000的数字
#!/bin/bash
grep -n -E --color=always -H "([1-9][0-9]{3})" 2.txt