正则表达式与常用小工具

正则表达式与常用小工具

扩展正则表达式

使用egrep或者grep -E 一般都是使用egrp

语法:
在这里插入图片描述
!与>字符在正则表达式中不是特殊字符,用的时候不许要特殊的转移

awk工具

awk是一个功能非常强大的文档编辑工具,它不仅能以行为单位还能以列为单位处理文件。

  1. 命令格式:
    awk [参数] ‘[ 动作]’ [文件名]

  2. 常见参数:
    -F 指定行的分隔符

  3. 常见动作:
    print 显示内容
    $0 显示当前行所有内容
    n 显 示 当 前 行 的 第 n 列 内 容 , 如 果 存 在 多 个 n 显示当前行的第n列内容,如果存在多个 nnn,它们之间使用逗号(,)隔开

  4. 常见内置变量

FILENAME 当前输入文件的文件名,该变量是只读的

NR 指定显示行的行号

NF 输出 最后一列的内容

OFS 输出格式的列分隔符,缺省是空格

FS 输入文件的列分融符,缺省是连续的空格和Tab

  1. 命令演示

模板文件内容

admin-1@ubuntu:~$ cat awk.txt
 
nihao awk awk awk
 
nihao awk awk awk

打印指定列内容

打印第1列的内容

admin-1@ubuntu:~$ awk '{print $1}' awk.txt
 
nihao
 
nihao

指定行打印内容

打印第一行第1和第3列内容

admin-1@ubuntu:~$ awk  'NR==1 {print $1,$3}' awk.txt
 
nihao awk

指定隔离分隔符,查看内容

admin-1@ubuntu:~$ cat linshi.txt
 
root:x:0:0:root:/root:/bin/bash
 
admin-1@ubuntu:~$ awk -F ':' '{print $1,$7}' linshi.txt
 
root /bin/bash

设置显示分隔符,显示内容

admin-1@ubuntu:~$ awk 'BEGIN{OFS=":"} {print NR,$0}' awk.txt
 
1:nihao awk awk awk
 
2:nihao awk awk awk

sed工具

Sed是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送完屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或者多个文件、化简对文件的反复操作、编写转换程序等。

  1. Sed使用参数
[root@www ~]# sed [-nefr] [动作]
选项与参数:
-n :使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
-e :直接在命令列模式上进行 sed 的动作编辑;
-f :直接将 sed 的动作写在一个文件内, -f filename 则可以运行 filename 内的 sed 动作;
-r :sed 的动作支持的是延伸型正规表示法的语法。(默认是基础正规表示法语法)
-i :直接修改读取的文件内容,而不是输出到终端。
 
动作说明: [n1[,n2]]function
n1, n2 :不见得会存在,一般代表『选择进行动作的行数』,举例来说,如果我的动作是需要在 10 到 20 行之间进行的,则『 10,20[动作行为] 』
 
function:
a :新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
c :取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
d :删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
i :插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p :列印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行~
s :取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正规表示法!例如 1,20s/old/new/g 就是啦!
  1. 以行尾单位的新增/删除
    将/etc/passwd的内容列出并且打印行号,同时,请将2~5进行删除
[root@www ~]# nl /etc/passwd | sed '2,5d'
1 root:x:0:0:root:/root:/bin/bash
6 sync:x:5:0:sync:/sbin:/bin/sync
7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
.....(后面省略).....

注:-d后面不接参数,另外sed后面接的动作,请务必以’'即两个单引号括住哦!

只要删除第2行

nl /etc/passwd | sed '2d'

要删除第3行到最后一行

nl /etc/passwd | sed '3,$d' 

在第二行的下一行添加"drink tea"内容

[root@www ~]# nl /etc/passwd | sed '2a drink tea'
1 root:x:0:0:root:/root:/bin/bash
2 bin:x:1:1:bin:/bin:/sbin/nologin
drink tea
3 daemon:x:2:2:daemon:/sbin:/sbin/nologin
.....(后面省略).....

注:参数a后面的内容就是要添加的内容。

那如果是要在第二行前

nl /etc/passwd | sed '2i drink tea'

如果是要增加两行以上,在第二行后面加入两行字,例如:“drink tea"和"drink beer”

[root@www ~]# nl /etc/passwd | sed '2a Drink tea or ......\
> drink beer ?'
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
Drink tea or ......
drink beer ?
daemon:x:2:2:daemon:/sbin:/sbin/nologin
.....(后面省略).....

注:每一行之间都必须要以反斜杠""来进行新行的添加。

  1. 以行为单位的替换与显示

将第2-5行的内容取代成为"No 2-5 number"

[root@www ~]# nl /etc/passwd | sed '2,5c No 2-5 number'
1 root:x:0:0:root:/root:/bin/bash
No 2-5 number
6 sync:x:5:0:sync:/sbin:/bin/sync
.....(后面省略).....

通过这个方法我们就可以将数据整行取代了。

仅列出passwd文件内的第5-7行

[root@liaozhongmin5 lavimer]# nl passwd | sed -n '5,7p'
     5	lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
     6	sync:x:5:0:sync:/sbin:/bin/sync
     7	shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown

注:-n是安静的执行,p通常和-n连用。

查找含有root的行

nl /etc/passwd | sed -n '/root/p'
1  root:x:0:0:root:/root:/bin/bash

注:如果不使用-n的话会打印所有的行,双斜杠表示正则表达式。

  1. 数据的搜寻并删除

删除/etc/passwd所有包含root的行,其他行输出

nl /etc/passwd | sed  '/root/d'
2  daemon:x:1:1:daemon:/usr/sbin:/bin/sh
3  bin:x:2:2:bin:/bin:/bin/sh
....下面忽略
#第一行的匹配root已经删除了
  1. 数据的搜寻并执行命令

搜索/etc/passwd,找到root对应的行,执行后面花括号中的一组命令,每个命令之间用分号分割,这里把bash替换为blueshell,再输出这行:

nl /etc/passwd | sed -n '/bash/{s/bash/blueshell/;p;q}'    
1  root:x:0:0:root:/root:/bin/blueshell

注:最后的q只是退出功能。

  1. 数据的搜寻并替换

除了整行的处理模式之外, sed 还可以用行为单位进行部分数据的搜寻并取代。基本上 sed 的搜寻与替代的与 vi 相当的类似!他有点像这样:

sed 's/要被取代的字串/新的字串/g'

先观察原始信息,利用 /sbin/ifconfig 查询 IP

[root@www ~]# /sbin/ifconfig eth0
eth0 Link encap:Ethernet HWaddr 00:90:CC:A6:34:84
inet addr:192.168.1.100 Bcast:192.168.1.255 Mask:255.255.255.0
inet6 addr: fe80::290:ccff:fea6:3484/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
.....(以下省略).....

本机IP是192.168.1.100

将IP前面部分予以删除:

[root@www ~]# /sbin/ifconfig eth0 | grep 'inet addr' | sed 's/^.*addr://g'
192.168.1.100 Bcast:192.168.1.255 Mask:255.255.255.0

接下来则是删除后续的部分,亦即: 192.168.1.100 Bcast:192.168.1.255 Mask:255.255.255.0

[root@www ~]# /sbin/ifconfig eth0 | grep 'inet addr' | sed 's/^.*addr://g' | sed 's/Bcast.*$//g'
192.168.1.100
  1. 多点编辑
    一条sed命令,删除/etc/passwd第三行到末尾行的数据,并把bash替换为blueshell
nl /etc/passwd | sed -e '3,$d' -e 's/bash/blueshell/'
1  root:x:0:0:root:/root:/bin/blueshell
2  daemon:x:1:1:daemon:/usr/sbin:/bin/sh

注:-e表示多点编辑,第一个编辑命令删除/etc/passwd第三行到末尾行的数据,第二行命令搜索bash替换为blueshell。

  1. 直接修改文件的内容(危险动作)

sed 可以直接修改文件的内容,不必使用管道命令或数据流重导向! 不过,由於这个动作会直接修改到原始的文件,所以请你千万不要随便拿系统配置来测试! 我们还是使用下载的 regular_express.txt 文件来测试看看吧!

利用 sed 将 regular_express.txt 内每一行结尾若为 . 则换成 !

[root@www ~]# sed -i 's/\.$/\!/g' regular_express.txt

利用 sed 直接在 regular_express.txt 最后一行加入『# This is a test』

[root@www ~]# sed -i '$a # This is a test' regular_express.txt

由于 $ 代表的是最后一行,而 a 的动作是新增,因此该文件最后新增『# This is a test』!

sed 的『 -i 』选项可以直接修改文件内容,这功能非常有帮助!举例来说,如果你有一个 100 万行的文件,你要在第 100 行加某些文字,此时使用 vim 可能会疯掉!因为文件太大了!那怎办?就利用 sed 啊!透过 sed 直接修改/取代的功能,你甚至不需要使用 vim 去修订!

sort 工具

sort 是一个以行为单位对文件内容进行排序的工具,也可以根据不同的数据类型来排序。例如数据和字符的牌局就不一样。sort 命令的语法为“sort [选项] 参数”,其中常用的选项包括以下几种。
(1)-f:忽略大小写;
(2)-b:忽略每行前面的空格;
(3)-M:按照月份进行排序;
(4)-n:按照数字进行排序;
(5)-r:反向排序;
(6)-u:等同于 uniq,表示相同的数据仅显示一行;
(7)-t:指定分隔符,默认使用[Tab]键分隔;
(8)-o <输出文件>:将排序后的结果转存至指定文件;
(9)-k:指定排序区域。
1:将/etc/passwd 文件中的账号进行排序。

[root@localhost ~]# sort /etc/passwd

在这里插入图片描述
2:将/etc/passwd 文件中第三列进行反向排序

[root@localhost ~]# sort -t ':' -rk 3 /etc/passwd

在这里插入图片描述
3、将/etc/passwd 文件中第三列进行排序,并将输出内容保存至user.txt 文件中

[root@localhost ~]# sort -t ':' -k 3 /etc/passwd -o user.txt 
[root@localhost ~]# cat user.txt 

在这里插入图片描述

uniq 工具

Uniq 工具在 Linux 系统中通常与 sort 命令结合使用,用于报告或者忽略文件中的重复行。具体的命令语法格式为:uniq [选项] 参数。其中常用选项包括以下几种。
(1)-c:进行计数;
(2)-d:仅显示重复行;
(3)-u:仅显示出现一次的行;
1:删除 testfile 文件中的重复行。

[root@localhost ~]# vim test
Linux 10
Linux 20
Linux 30
Linux 30
Linux 30
CentOS 6.5
CentOS 6.5
CentOS 6.5
CentOS 7.3
CentOS 7.3
CentOS 7.3
CentOS 6.5
CentOS 6.5
[root@localhost ~]# uniq test

在这里插入图片描述
2:删除 testfile 文件中的重复行,并在行首显示该行重复出现的次数

在这里插入代码片[root@localhost ~]# uniq -c  test

在这里插入图片描述
3、查找 testfile 文件中的重复行。

[root@localhost ~]# uniq -d  test

在这里插入图片描述

tr工具

tr工具用于 字符的替换删除 (注意是字符不是字符串)

  1. 语法
    commands | tr ‘str1’ ‘str2’
    tr ‘str1’ ‘str2’ < tr.txt
    tr [选项] ‘str1’ <tr.xt

  2. 选项
    -d:删除str1中所有输入字符
    -s:删除所有连续重复出现的字符序列

  3. 常用的匹配字符

a-z
A-Z
0-9

  1. 例子
    tr.txt内容
hello:world
hello:morning
aaaabbbbbcccccc
abcabcabc


cat tr.txt | tr ‘a-z’ ‘A-Z’ 全部替换成大写
cat tr.txt | tr ‘a-z:’ ‘A-Z/’ 全部替换成大写&&:替换成/

tr ‘:’ ‘/’ <tr.txt :替换成/

tr -d ‘a-z’ <tr.txt 删除所有的小写字母

tr -s ‘a-z’ < tr.txt 压缩字符 变成如下

helo:world
helo:morning
abc
abcabcabc


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值