http://bbs.chinaunix.net/thread-445229-1-1.html
当从一个文件或命令输出中抽取或过滤文本时,可以使用正则表达式( R E),正则表达式是一些特殊或不很特殊的字符串模式的集合。
基本元字符集及其含义
原帖由 "网中人" 发表:
abc: 表示 abc 三個連續的字符, 但彼此獨立而非集合. (可簡單視為三個 char. set)
(abc): 表示 abc 這三個連續字符的集合. (可簡單視為一個 char. set)
a|b: 表示單一字符, 或 a 或 b .
(abc|xyz): 表示或 abc 或 xyz 這兩個 char. set 之一. (註二)
[abc]: 表示單一字符, 可為 a 或 b 或 c . (與 wildcard 之 [abc] 原理相同)
[^abc]: 表示單一字符, 不為 a 或 b 或 c 即可. (與 wildcard 之 [!abc] 原理相同)
. : 表示任意單一字符. (與 wildcard 之 ? 原理相同)
- ^ 只只匹配行首
- $ 只只匹配行尾
- * 只一个单字符后紧跟*,匹配0个或多个此单字符
- [ ] 只匹配[ ]内字符。可以是一个单字符,也可以是字符序列。可以使用-
- 表示[ ]内字符序列范围,如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
- \ 只用来屏蔽一个元字符的特殊含义。因为有时在s h e l l中一些元字符有
- 特殊含义。\可以使其失去应有意义
- . 只匹配任意单字符
- p a t t e r n \ { n \ } 只用来匹配前面p a t t e r n出现次数。n为次数
- p a t t e r n \ { n,\ } m 只含义同上,但次数最少为n
- p a t t e r n \ { n,m \ } 只含义同上,但p a t t e r n出现次数在n与m之间
- 现在详细讲解其中特殊含义。
- ^ 对行首
- $ 对行尾
- ^ [ t h e ] 对以t h e开头行
- [ S s ] i g n a [ l L ] 对匹配单词s i g n a l、s i g n a L、S i g n a l、S i g n a L
- [Ss]igna[lL]\. 对同上,但加一句点
- [ m a y M A Y ] 对包含m a y大写或小写字母的行
- ^ U S E R $ 对只包含U S E R的行
- [tty]$ 对以t t y结尾的行
- \ . 对带句点的行
- ^ d . . x . . x . . x 对对用户、用户组及其他用户组成员有可执行权限的目录
- ^ [ ^ l ] 对排除关联目录的目录列表
- [ . * 0 ] 对0之前或之后加任意字符
- [ 0 0 0 * ] 对0 0 0或更多个
- [ iI] 对大写或小写I
- [ i I ] [ n N ] 对大写或小写i或n
- [ ^ $ ] 对空行
- [ ^ . * $ ] 对匹配行中任意字符串
- ^ . . . . . . $ 对包括6个字符的行
- [a- zA-Z] 对任意单字符
- [ a - z ] [ a - z ] * 对至少一个小写字母
- [ ^ 0 - 9 \ $ ] 对非数字或美元标识
- [ ^ 0 - 0 A - Z a - z ] 对非数字或字母
- [ 1 2 3 ] 对1到3中一个数字
- [ D d ] e v i c e 对单词d e v i c e或D e v i c e
- D e . . c e 对前两个字母为D e,后跟两个任意字符,最后为c e
- \ ^ q 对以^ q开始行
- ^ . $ 对仅有一个字符的行
- ^\.[0-9][0-9] 对以一个句点和两个数字开始的行
- ' " D e v i c e " ' 对单词d e v i c e
- D e [ V v ] i c e \ . 对单词D e v i c e或d e v i c e
- [ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 4 \ } 对日期格式d d - m m - y y y y
- [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } 对I P地址格式nnn. nnn.nnn.nnn
- [ ^ . * $ ] 对匹配任意行