一、 概述
正则表达式是一种处理字符串的方法,以行为处理单位,旨在大量信息中获取目标信息。
二、 grep
1.基本语法
参数说明:
-a:将二进制文件以text文件的的方式搜索
-c:计算找到目标字符串的次数
-i:忽略大小写
-n:输出目标字符串所在行号
-v:反向选择
2.搜索特定字符串
(1)搜索the
(2)不区分大小写搜索the
(3)反向搜索the
3.利用[]搜索集合字符
(1) 搜索test或tastes
(2) 搜索包含oo的内容
(3) 搜索oo前面一个字符不是g的内容
(4) 搜索oo前一个字符不是小写字母的内容
(5) 搜索包含数字的内容
4.行首字符 ^
(1) 搜索行首为the的内容
(2) 搜索行首是小写字母的内容
(3)^在括号内、外的区别
5.行尾字符 $
6.任意字符 .
7.重复字符 *
(1) 搜索连续出现至少两个o的内容
(2) 搜索以g开头且以g结尾且至少中间包含一个o的内容
(3)0个或多个任意字符 .*
8.限定RE字符范围
(1) 搜索限定(2个)连续o的内容
(2) 搜索2-5个连续o的内容
(3) 搜索以g开头以g结尾且包含2个连续o的内容
三、 Sed
1.简介
sed是一个很好的文件处理工具,本身是一个管道命令,主要是以行为单位进行处理,可以将数据行进行替换、删除、新增、选取等特定工作。
2.基本语法
常用选项:
-n∶使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN的资料一般都会被列出到萤幕上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
-e∶直接在指令列模式上进行 sed 的动作编辑;
-f∶直接将 sed 的动作写在一个档案内, -f filename 则可以执行 filename 内的sed 动作;
-r∶sed 的动作支援的是延伸型正规表示法的语法。(预设是基础正规表示法语法)
-i∶直接修改读取的档案内容,而不是由萤幕输出。
常用命令:
a ∶新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)
c ∶取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
d ∶删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
i ∶插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p∶列印,亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起运作~
s∶取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正规表示法!例如 1,20s/old/new/g 就是啦!
3.示例
以文件名为regular_expression_sed的文件为例,来进行以下操作。
(1)删除某行
dw@dw:~$ sed '1d' regular_expression_sed #删除第一行
dw@dw:~$ sed '$d' regular_expression_sed #删除最后一行
dw@dw:~$ sed '1,2d' regular_expression_sed #删除第一行到第二行
dw@dw:~$ sed '2,$d' regular_expression_sed #删除第二行到最后一行
(2)显示某行
dw@dw:~$ sed –n '1p' regular_expression_sed #显示第一行
dw@dw:~$ sed –n '$p' regular_expression_sed #显示最后一行
dw@dw:~$sed –n '1,2p' regular_expression_sed #显示第一行到第二行
dw@dw:~$ sed –n '2,$p' regular_expression_sed #显示第二行到最后一行
(3)使用模式进行查询
dw@dw:~$ sed -n '/good/p' regular_expression_sed #查询包括关键字ruby所在所有行
dw@dw:~$ sed -n '/\$/p' regular_expression_sed #查询包括关键字$所在所有行,使用反斜线\屏蔽特殊含义
(4)增加一行或多行字符串
dw@dw:~$ sed '1a drink tea' regular_expression_sed #第一行后增加字符串"drink tea"
dw@dw:~$ sed '1,3a drink tea' regular_expression_sed #第一行到第三行后增加字符串"drink tea"
dw@dw:~$ sed '1a drink tea\nor coffee' regular_expression_sed #第一行后增加多行,使用换行符\n
(5)替换一行或多行
格式:sed ‘s/要替换的字符串/新的字符串/g’ (要替换的字符串可以用正则表达式)
dw@dw:~$ sed -n '/good/p' regular_expression_sed | sed 's/ruby/bad/g' #替换good为bad
dw@dw:~$ sed -n '/good/p' regular_expression_sed | sed 's/good//g' #删除good
(6)插入
dw@dw:~$sed -i '$a bye' regular_expression_sed #在文件最后一行直接输入"bye"
(7) 删除匹配行`
sed -i '/匹配字符串/d' filename
四、操作模板