关闭

linux命令终极系列(grep)

标签: linuxaction正则表达式filebugsunix
494人阅读 评论(0) 收藏 举报
分类:
一.grep命令常用参数
(1)-A NUM
       #grep -A 1 aa test.txt
        说明:从test.txt中搜寻有aa样式的行,并显示该行的后1行
 (2)-B NUM 
       #grep -B 1 aa test.txt
        说明:从test.txt中搜寻有aa样式的行,并显示该行的前1行
   (3) -C NUM
        #grep -C 2 aa test.txt
        说明:列出file中除包含panda样式的行外并列出其上下2行
    (4) -a或--test
        #grep -a aa *.tar.gz
       说明:如果不加-a,找到后,一般会显示“匹配到二进制文件 tp_smapi-0.40.tgz”,找不到
                 不显示任何内容。加-a后,可将二进位档案视为文字档案搜寻,找到后,可以显示乱码等。
 (5)-b, --byte-offset
        #grep -b aa test.txt
        说明:列出样式查找到的位置到文件开始有多少个字节(也可以认为是偏移)
  (6)--binary-files=TYPE
        说明: 此参数TYPE预设为binary(二进位),若以普通方式搜寻,只有2种结果:
                   *若有符合的地方:显示Binary file 二进位档名 matches
                   *若没有符合的地方:什麽都没有显示。                
                   *若TYPE为without-match,遇到此参数,grep会认为此二进位档案没有
                     包含任何搜寻样式,与-I 参数相同。
                   *若TPYE为text, grep会将此二进位档视为text档案,与-a 参数相同。
                    注意: --binary-files=text 若输出为终端机,可能会产生一些不必要的输出
     (7) -c 或--count
         #grep -c aa test.txt
         说明:显示匹配到的总行数
   (8)-d ACTION, --directories=ACTION
           grep -d recurse aa *
           说明:将递归查找包含aa的文件
                      若输入的档案是一个资料夹,使用ACTION去处理这个资料夹。ACTION可以为以下几种值
                       *预设ACTION是read(读取),也就是说此资料夹会被视为一般的档案;
                       *若ACTION是skip(略过),资料夹会被grep略过:
                       *若ACTION是recurse(递),grep会去读取资料夹下所有的档案,
                         此相当於-r 参数。
  (9)  -E, --extended-regexp
         说明:采用规则表示式去解释样式。
    (10)  -e PATTERN, --regexp=PATTERN
       把样式做为一个partern,通常用在避免partern用-开始
    (11)   -f FILE, --file=FILE
       事先将要搜寻的样式写入到一个档案,一行一个样式。
       然後采用档案搜寻。
       空的档案表示没有要搜寻的样式,因此也就不会有任何符合。
       
   ex: (newfile为搜寻样式档)
       $grep -f newfile file    

   (12).  -G, --basic-regexp
       将样式视为基本的规则表示式解释。(此为预设)

   (13).  -H, --with-filename
       在每个符合样式行前加上符合的档案名称,若有路径会显示路径。
       
   ex: (在file与testfile中搜寻panda样式)   
       $grep -H panda file ./testfile
                file:panda
                ./testfile:panda
                $
     
   (14).  -h, --no-filename  
               与-H参数相类似,但在输出时不显示路径。

   (15).  -I
               grep会强制认为此二进位档案没有包含任何搜寻样式,
               与--binary-files=without-match参数相同。
                   
           ex:  $ grep -I  panda mv

   (16).  -i, --ignore-case       
               忽略大小写,包含要搜寻的样式及被搜寻的档案。
               
           ex:  $ grep -i panda mv
                
   (17).  -L, --files-without-match 
               不显示平常一般的输出结果,反而显示出没有符合的档案名称。

   (18).  -l, --files-with-matches               
               不显示平常一般的输出结果,只显示符合的档案名称。

   (19).  --mmap               
               如果可能,使用mmap系统呼叫去读取输入,而不是预设的read系统呼叫。 
               在某些状况,--mmap 能产生较好的效能。 然而,--mmap 
               如果运作中档案缩短,或I/O 错误发生时,
               可能造成未定义的行为(包含core dump),。
               
   (20).  -n, --line-number
               在显示行前,标上行号。
               
            ex:  $ grep -n  panda file  
                显示结果相似於下:
                行号:符合行的内容

   (21).  -q, --quiet, --silent 
               不显示任何的一般输出。请参阅-s或--no-messages

   (22).  -r, --recursive
       递地,读取每个资料夹下的所有档案,此相当於 -d recsuse 参数。

   (23).  -s, --no-messages
       不显示关於不存在或无法读取的错误讯息。
     
 小: 不像GNU grep,传统的grep不符合POSIX.2协定,
       因为缺乏-q参数,且他的-s 参数表现像GNU grep的 -q 参数。
       Shell Script倾向将传统的grep移植,避开-q及-s参数,
       且将输出限制到/dev/null。
    
POSIX: 定义UNIX及UNIX-like系统需要提供的功能。              
    
   (24).  -V, --version
  显示出grep的版本号到标准错误。
  当您在回报有关grep的bugs时,grep版本号是必须要包含在内的。

   (25).  -v, --invert-match
  显示除搜寻样式行之外的全部。
                   
   (26).  -w, --word-regexp
          将搜寻样式视为一个字去搜寻,完全符合该"字"的行才会被列出。

   (27).  -x, --line-regexp
  将搜寻样式视为一行去搜寻,完全符合该"行"的行才会被列出


二. grep正则表达式
( 1 ) grep正则表达式元字符集:

^ 锚定行的开始 如:'^grep'匹配所有以grep开头的行。 
$ 锚定行的结束 如:'grep$'匹配所有以grep结尾的行。 
. 匹配一个非换行符的字符 如:'gr.p'匹配gr后接一个任意字符,然后是p。 
* 匹配零个或多个先前字符 如:'*grep'匹配所有一个或多个空格后紧跟grep的行。 .*一起用代表任意字符。
[] 匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。 
[^] 匹配一个不在指定范围内的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一个字母开头,紧跟rep的行。 
\(..\) 标记匹配字符,如'\(love\)',love被标记为1。 
\< 锚定单词的开始,如:'\<grep'匹配包含以grep开头的单词的行。 
\> 锚定单词的结束,如'grep\>'匹配包含以grep结尾的单词的行。 
x\{m\} 重复字符x,m次,如:'0\{5\}'匹配包含5个o的行。 
x\{m,\} 重复字符x,至少m次,如:'o\{5,\}'匹配至少有5个o的行。 
x\{m,n\}重复字符x,至少m次,不多于n次,如:'o\{5,10\}'匹配5--10个o的行。
\w 匹配文字和数字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零个或多个文字或数字字符,然后是p。
\b 单词锁定符,如: '\bgrep\b'只匹配grep。

(2) 实例:
关于匹配的实例:
grep -"48" test.txt 统计所有以“48”字符开头的行有多少
grep -"May" test.txt 不区分大小写查找“May”所有的行)
grep -"48" test.txt 显示行号;显示匹配字符“48”的行及行号,相同于 nl test.txt |grep 48)
grep -"48" test.txt 显示输出没有字符“48”所有的行)
grep "471" test.txt 显示输出字符“471”所在的行)
grep "48<tab>;" test.txt 显示输出以字符“48”开头,并在字符“48”后是一个tab键所在的行
grep "48[34]" test.txt 显示输出以字符“48”开头,第三个字符是“3”或是“4”的所有的行)
grep "^[^48]" test.txt 显示输出行首不是字符“48”的行)
grep "[Mm]ay" test.txt 设置大小写查找:显示输出第一个字符以“M”或“m”开头,以字符“ay”结束的行)
grep "K…D" test.txt 显示输出第一个字符是“K”,第二、三、四是任意字符,第五个字符是“D”所在的行)
grep "[A-Z][9]D" test.txt 显示输出第一个字符的范围是“A-D”,第二个字符是“9”,第三个字符的是“D”的所有的行
grep "[35]..1998" test.txt 显示第一个字符是3或5,第二三个字符是任意,以1998结尾的所有行
grep "4\{2,\}" test.txt 模式出现几率查找:显示输出字符“4”至少重复出现两次的所有行
grep "9\{3,\}" test.txt 模式出现几率查找:显示输出字符“9”至少重复出现三次的所有行
grep "9\{2,3\}" test.txt 模式出现几率查找:显示输出字符“9”重复出现的次数在一定范围内,重复出现2次或3次所有行
grep -"^$" test.txt 显示输出空行的行号
ls -|grep "^d" 如果要查询目录列表中的目录 同:ls -*
ls -|grep "^[^d]" 在一个目录中查询不包含目录的所有文件(开头为非d)

ls -|grpe "^d…..x..x" 查询其他用户和用户组成员有可执行权限的目录集合


转自:http://www.cppblog.com/API/archive/2011/04/17/144418.html

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:178100次
    • 积分:2472
    • 等级:
    • 排名:第15467名
    • 原创:85篇
    • 转载:17篇
    • 译文:0篇
    • 评论:40条
    我的微博
    最新评论