Linux之Shell 操作实用技巧

最新推荐文章于 2022-12-02 10:12:49 发布

编程有了模型

最新推荐文章于 2022-12-02 10:12:49 发布

阅读量632

点赞数

分类专栏： linux

本文链接：https://blog.csdn.net/qq_1018944104/article/details/83999231

版权

linux 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

1.Shell 操作日期时间

linux 系统为我们提供了一个命令 date，专门用来显示或者设置系统日期时间的。

语法格式：date [option]... [+format] 或者 date [-u | -utc | -universal] [MMDDhhmm[[CC]YY][.ss]]

常用的可选项有：

--help：显示辅助信息

--version：显示date命令版本信息

-u：显示目前的格林威治时间

-d：做日期时间相关的运算

--date='-dateStr'：做日期时间的相关运算

1.1. 显示系统当前日期时间

[root@hadoop ~]# date

[root@hadoop ~]# date '+%Y-%m-%d %H:%M:%S'

1.2.设置系统日期时间

[root@hadoop ~]# date -s "2017-01-01 01:01"

[root@hadoop ~]# date --set="2017-01-01 01:01"

1.3.日期计算

有时候，我们操作日期时间，经常会要获取前几天或后几天的时间，那么date命令给我们提供了实现这个功能的可选项 '-d' 和 '--date' ，请看下面的例子：

先看 '-d'：

##获取下一天的时间

##获取上一天的时间

##获取下一月的时间

##获取上一月的时间

##获取下一年的时间

##获取上一年的时间

##获取下一周、下周一、下周四的日期时间

**********************************

##获取下一天的时间

[root@hdp1 ~]# date -d next-day '+%Y-%m-%d %H:%M:%S'

2017-05-07 02:11:13

[root@hdp1 ~]# date -d 'next day' '+%Y-%m-%d %H:%M:%S'

2017-05-07 02:19:24

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S' -d tomorrow

2017-05-07 02:20:28

##获取上一天的时间

[root@hdp1 ~]# date -d last-day '+%Y-%m-%d %H:%M:%S'

2017-05-05 02:22:34

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S' -d yesterday

2017-05-05 02:22:59

##获取下一月的时间

[root@hadoop ~]# date -d next-month '+%Y-%m-%d %H:%M:%S'

##获取上一月的时间

[root@hadoop ~]# date -d last-month '+%Y-%m-%d %H:%M:%S'

##获取下一年的时间

[root@hadoop ~]# date -d next-year '+%Y-%m-%d %H:%M:%S'

##获取上一年的时间

[root@hadoop ~]# date -d last-year '+%Y-%m-%d %H:%M:%S'

##获取下一周、下周一、下周四的日期时间

[root@hadoop ~]# date -d next-week '+%Y-%m-%d %H:%M:%S'

[root@hadoop ~]# date -d next-monday '+%Y-%m-%d %H:%M:%S'

[root@hadoop ~]# date -d next-thursday '+%Y-%m-%d %H:%M:%S'

那么类似的，其实，last-year，last-month，last-day，last-week，last-hour，last-minute，last-second都有对应的实现。相反的，last对应next，自己可以根据实际情况灵活组织

接下来，我们来看 '--date' ，它帮我实现任意时间前后的计算，来看具体的例子：

##获取一天以后的日期时间

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S' --date='1 day'

2017-05-07 02:27:57

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S' --date='-1 day ago'

2017-05-07 02:28:06

##获取一天以前的日期时间

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S' --date='-1 day'

2017-05-05 02:28:38

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S' --date='1 day ago'

2017-05-05 02:28:50

上面的例子显示出来了使用的格式，使用精髓在于改变前面的字符串显示格式，改变数据，改变要操作的日期对应字段，除了天也有对应的其他实现：year，month，week，day，hour，minute，second，monday（星期，七天都可）

1.4.自定义日期格式

date 能用来显示或设定系统的日期和时间，在显示方面，使用者能设定欲显示的格式，格式设定为一个加号后接数个标记，其中可用的标记列表如下：

使用范例如下：

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S'

2018-10-31 23:49:00

日期方面：

%a : 星期几 (Sun..Sat)

%A : 星期几 (Sunday..Saturday)

%b : 月份 (Jan..Dec)

%B : 月份 (January..December)

%c : 直接显示日期和时间

%d : 日 (01..31)

%D : 直接显示日期 (mm/dd/yy)

%h : 同 %b

%j : 一年中的第几天 (001..366)

%m : 月份 (01..12)

%U : 一年中的第几周 (00..53) (以 Sunday 为一周的第一天的情形)

%w : 一周中的第几天 (0..6)

%W : 一年中的第几周 (00..53) (以 Monday 为一周的第一天的情形)

%x : 直接显示日期 (mm/dd/yyyy)

%y : 年份的最后两位数字 (00.99)

%Y : 完整年份 (0000..9999)

时间方面：

%%: 打印出%

%n : 下一行

%t : 跳格

%H : 小时(00..23)

%k : 小时(0..23)

%l : 小时(1..12)

%M : 分钟(00..59)

%p : 显示本地AM或PM

%P : 显示本地am或pm

%r : 直接显示时间(12 小时制，格式为 hh:mm:ss [AP]M)

%s : 从 1970 年 1 月 1 日 00:00:00 UTC 到目前为止的秒数

%S : 秒(00..61)

%T : 直接显示时间(24小时制)

%X : 相当于%H:%M:%S %p

%Z : 显示时区

若是不以加号作为开头，则表示要设定时间，而时间格式为 MMDDhhmm[[CC]YY][.ss]

MM 为月份

DD 为日

hh 为小时

mm 为分钟

CC 为年份前两位数字

YY 为年份后两为数字

ss 为秒数

例子：

[root@hdp1 ~]# date "050602032017.55"

Sat May 6 02:03:55 CST 2017

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S'

2018-10-31 23:49:00

1.5. 有用小技巧

##获取相对某个日期前后的日期

##把时间中无用的0去掉，比如01:02:25 变成 1:2:25

##显示文件最后被更改的时间

##求两个字符串日期之间的相隔的天数

##shell 中加减指定时间单位

***************************************************************

##获取相对某个日期前后的日期

[root@hdp1 ~]# date '+%Y-%m-%d %H:%M:%S' -d '2018-11-1 -2 week'

2018-10-18 00:00:00

##把时间中无用的0去掉，比如01:02:25 变成 1:2:25

[root@hdp1 ~]# date '+%Y-%m-%d %-H:%-M:%-S' -d '2018-11-1 01:02:03 -1 day'

2018-11-02 10:2:3

##显示文件最后被更改的时间

[root@hdp1 ~]# date '+%Y-%m-%d %-H:%-M:%-S' -r ./a.sh

2018-10-31 23:0:53

##求两个字符串日期之间的相隔的天数

[root@hdp1 ~]# echo "($(date +%s)-$(date +%s -d '1994-02-06'))/60/60/24" | bc

9034

##shell 中加减指定时间单位

[root@hdp1 ~]# A=$(date '+%Y-%m-%d')

[root@hdp1 ~]# B=$(date '+%Y-%m-%d' -d 'A +48 hours')

[root@hdp1 ~]# echo $B

2018-11-04

[root@hdp1 ~]# B=`date +%Y-%m-%d -d "A +48 hours"`

[root@hdp1 ~]# echo $B

2018-11-04

[root@hdp1 ~]# B=`date +%Y-%m-%d -d "$A +48 hours"`

[root@hdp1 ~]# echo $B

2018-11-03

2.高级文本处理命令

2.1.wc

功能：统计文件行数、字节、字符数

常用选项：

-l：统计多少行

-w：统计字数

-c：统计文件字节数，一个英文字母1字节，一个汉字占2-4字节（根据编码）

-m：统计文件字符数，一个英文字母1个字符，一个汉字占1字节

-L：统计最长行的长度，也可以统计字符串长度

--help：显示帮助信息

--version：显示版本信息

一个汉字到底占几个字节？

占2个字节：〇

占3个字节：基本等同于GBK，含21000多个汉字

占4个字节：中日韩超大字符集里面的汉字，有5万多个

一个utf8数字占1个字节

一个utf8英文字母占1个字节

示例：

##统计文件信息

##统计字符串长度

##统计文件行数

##统计文件字数

****************************************************

##统计文件信息

[root@hdp1 ~]# wc wc.txt

9 9 65 wc.txt

分别是：行数、单词数、字节数、文件名

##统计字符串长度

[root@hdp1 ~]# echo "dafasdfa" | wc -L

##统计文件行数

[root@hdp1 ~]# wc -l wc.txt

9 wc.txt

##统计文件字数

[root@hdp1 ~]# wc -w wc.txt

9 wc.txt

2.2.sort

功能：排序文本，默认对整列有效

常用可选项：

-f：忽略字母大小写，就是将小写字母视为大写字母排序

-M：根据月份比较，比如JAN、DEC

-h：根据易读的单位大小比较，比如2K、1G

-g：按照常规数值排序

-n：按照字符串数值比较

-r：倒序排序

-k:pos1,pos2 根据关键字排序，在从第位置1开始，位置2结束

-t：指定分割符

-u：去重重复行

-o：将结果写入文件

准备数据：

aaa:10:1.1

ccc:20:3.3

bbb:40:4.4

eee:40:5.5

ddd:30:3.3

bbb:40:4.4

fff:30:2.2

示例：

[linux@linux ~]$ cat sort.txt ## 准备排序文件，查看该内容

aaa:10:1.1

ccc:20:3.3

bbb:40:4.4

eee:40:5.5

ddd:30:3.3

bbb:40:4.4

fff:30:2.2

[linux@linux ~]$ sort sort.txt ## 直接排序，把整行当做一列字符串，字典顺序

aaa:10:1.1

bbb:40:4.4

ccc:20:3.3

ddd:30:3.3

eee:40:5.5

fff:30:2.2

[linux@linux ~]$ sort -nk 2 -t : sort.txt ## 以:作为分隔符，取第二个字段按照数值进行排序

aaa:10:1.1

ccc:20:3.3

fff:30:2.2

ddd:30:3.3

bbb:40:4.4

eee:40:5.5

[linux@linux ~]$ sort -nk 2 -u -t : sort.txt ## 和上一个不一样的是-u为了去重，根据排序列去重的

aaa:10:1.1

ccc:20:3.3

ddd:30:3.3

bbb:40:4.4

多列排序：以:分隔，按第二列数值排倒序，第三列正序

[linux@linux ~]$ sort -n -t: -k2,2r -k3 sort.txt ????

bbb:40:4.4

eee:40:5.5

fff:30:2.2

ddd:30:3.3

ccc:20:3.3

aaa:10:1.1

2.3.uniq

取出重复行，只会统计相邻。

常用选项：

-c：打印出现次数

-d：只打印重复行

-u：只打印不重复行

-D：只打印重复行，并且把所有重复行打印出来

-f N：比较时跳过前N列

-i：忽略大小写

-s N：比较式跳过前N个字符

-w N：对每行第N个字符以后内容不做比较

准备数据：

abc

xyz

cde

xyz

abd

示例1：

[linux@linux ~]$ uniq uniq.txt ## 直接去重，只能在相邻行去重

abc

xyz

cde

xyz

abd

[linux@linux ~]$ sort uniq.txt | uniq ## 先给文件排序，然后去重

abc

abd

cde

xyz

[linux@linux ~]$ sort uniq.txt | uniq -c ## 打印每行重复次数

1 abc

1 abd

2 cde

2 xyz

[linux@linux ~]$ sort uniq.txt | uniq -u -c ## 打印不重复行，并给出次数

1 abc

1 abd

[linux@linux ~]$ sort uniq.txt | uniq -d -c ## 打印重复行，并给出次数

2 cde

2 xyz

[linux@linux ~]$ sort uniq.txt | uniq -w 2 ## 以开头前两个字符为判断标准去重

abc

cde

xyz

示例2：

先准备两个文件：a.txt 和 b.txt

文件内容分别为：

[root@hdp1 ~]# cat a.txt

[root@hdp1 ~]# cat b.txt

需求：

##求两个文件的交集：

[root@hdp1 ~]# cat a.txt b.txt | sort | uniq -d -c

##求两个文件的并集：

[root@hdp1 ~]# cat a.txt b.txt | sort | uniq

##求a.txt和b.txt的差集

[root@hdp1 ~]# cat a.txt b.txt b.txt | sort | uniq -u

##求b.txt和a.txt的差集

[root@hdp1 ~]# cat b.txt a.txt a.txt | sort | uniq -u

2.4.cut

cut命令可以从一个文本文件或文本流中提取文本列。

cut语法：

cut -d'分隔字符' -f fields ##用于有特定分分隔字符

cut -c 字符区间 ##用于排列整齐的信息

选项与参数：

-d：后面接分隔符，与-f一起使用

-f：依据-d的分隔符将一段信息分割成为字段，用-f取出第几段的意思

-c：按照字符截取

-b：按照字节截取

例子1：

首先看PATH变量：

[root@localhost ~]# echo $PATH

/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin

##将PATH变量取出，找出第五个路径

[root@localhost ~]# echo $PATH | cut -d ':' -f 5

/usr/sbin

##将PATH变量取出，找出第三和第五个路径，以下三种方式都OK

[root@localhost ~]# echo $PATH | cut -d ':' -f 3,5

[root@localhost ~]# echo $PATH | cut -d : -f 3,5

[root@localhost ~]# echo $PATH | cut -d: -f3,5

/sbin:/usr/sbin

##将PATH变量取出，找出第三到最后一个路径

[root@localhost ~]# echo $PATH | cut -d ':' -f 3-

/sbin:/bin:/usr/sbin:/usr/bin:/root/bin

##将PATH变量取出，找出第一到第三，还有第五个路径

[root@localhost ~]# echo $PATH | cut -d ':' -f 1-3,5

/usr/local/sbin:/usr/local/bin:/sbin:/usr/sbin

例子2：

##先准备已空格分开的这么段数据：

黄渤 huangbo 18 jiangxi

徐峥 xuzheng 22 hunan

王宝强 wangbaoqiang 44 liujiayao

##获取中间的年龄：

[root@localhost ~]# cut -f 3 -d ' ' cut.txt

##获取第二个字符到第五个字符之间的字符：

[root@localhost ~]# cut -c 2-5 cut.txt

渤 hu

峥 xu

宝强 w

##获取第四个字节到第六个字节中的字符：

[root@hadoop ~]# cut -b 4-6 cut.txt

渤

峥

宝

2.5.grep（文本生成器）

grep是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行统计出来。

命令：grep [选项] [-color=auto] "搜索字符串" filename

常用选项：

-c：统计符合条件的字符串出现的总行数

-E：支持扩展正则表达式

-i：忽略大小写

-n：在显示匹配到的字符串前面加上行号

-v：显示没有“搜索字符串”内容的那一行

-l：列出文件内容中有搜索字符串的文件名称

-o：只输出文件中匹配到的部分

-color=auto：将匹配到的字符串高亮起来

基本使用：

##查询包含hadoop的行

[root@localhost ~]# grep hadoop /etc/passwd

hadoop:x:500:504:hadoop01:/home/hadoop:/bin/bash

## 寻找当前路径下所有txt当中内容那些是带了huangbo字符串的

[root@localhost ~]# grep huangbo ./*.txt

./mazhonghua.txt:my name is huangbo is is huangbo

./sutdent.txt:huangbo 18 jiangxi

高级使用：

准备数据：

[root@hdp1 ~]# cat grep.txt

huangbo is shuaige

huangxiaoming is shuaige

liuyifei is meinv

hello world hello tom hello kitty

#how old are you

#one two three four five six seven eight nine ten

##统计出现某个字符串的行的总行数

[root@hdp1 ~]# grep -c 'hello' grep.txt

[root@hdp1 ~]# grep -c 'is' grep.txt

[root@hdp1 ~]# grep -c hello grep.txt

[root@hdp1 ~]# grep -c is grep.txt

##查询不包含is的行

[root@hdp1 ~]# grep -v 'is' grep.txt

hello world hello tom hello kitty

#how old are you

#one two three four five six seven eight nine ten

##正则表达包含huang

[root@hdp1 ~]# grep '.*huang.*' grep.txt

huangbo is shuaige

huangxiaoming is shuaige

##输出匹配行的前后N行（会包括匹配行）

使用-A参数输出匹配行的后一行：grep -A 1 "huangxiaoming" grep.txt

使用-B参数输出匹配行的前一行：grep -B 1 "huangxiaoming" grep.txt

使用-C参数输出匹配行的前后各一行：grep -C 1 "huangxiaoming" grep.txt

正则表达式：

#正则表达式：点代表任意一个字符

[root@hdp1 ~]# grep 'h.*p' /etc/passwd

#正则表达式：以hadoop开头

[root@hdp1 ~]# grep '^hdp01' /etc/passwd

#正则表达式：以hadoop结尾

[root@hdp1 ~]# grep 'hdp01$' /etc/passwd

#正则表达式：以h或r开头

[root@hdp1 ~]# grep '^[hr]' /etc/passwd

#不以h和r开头

[root@hdp1 ~]# grep '^[^hr]' /etc/passwd

#不以h到r开头

[root@hdp1 ~]# grep '^[^h-r]' /etc/passwd

正则表达式的简单规则：

. : 任意一个字符

a* : 任意多个a(零个或多个a)

a? : 零个或一个a

a+ : 一个或多个a

.* : 任意多个任意字符

\. : 转义.

o\{2\} : o重复两次

[A-Z]：A-Z任意一个字符

[ABC]：ABC中任意一个字符

##查找不是以#开头的行

[root@localhost ~]# grep -v '^#' grep.txt

[root@localhost ~]# grep -v '^#' grep.txt | grep -v '^$'

2.6.sed（流编辑器）

sed叫做流编辑器，在shell脚本和Makefile中作为过滤——使用非常普遍，也就是把前一个程序的输出引入sed的输入，经过一些列编辑命令转换成另一种格式输出。sed是一种在线编辑器，它一次处理一行内容，处理时，把当前处理的行存储在临时缓冲区中，称为模式空间，接着用sed命令处理缓冲区中的内容，处理完成后，把缓存区的内容送我屏幕。接着处理下一行，这样不断重复，直到文件末尾。文件的内容并没有改变，除非你使用重定向存储输出。

选项：

-n：一般sed命令会把所有数据输出到屏幕，如果加入-n选项的话，则只会把经过sed命令处理的行输出到屏幕。

-e：多点编辑，允许对输入数据应用多条sed命令编辑

-i：用sed的修改结果直接修改读取数据的文件，而不会由屏幕输出。

动作：

a：追加，在当前行后添加一行或多行

c：行替换，用c后面的字符串填好原数据行

d：行删除命令，前面跟数字指定删除的行

i：插入，在当前行前插入一行或多行

p：打印，输出指定的行

s：字符串替换，用一个字符串替换另一个字符串。格式为 '行范围 s/旧字符串/新字符串/g' （如果不加g的话，则表示只替换每行第一个匹配的字符串）

1、删除：d命令

#删除sed.txt文件的第二行。

sed '2d' sed.txt

#删除sed.txt文件的第二行到末尾所有行。

sed '2,$d' sed.txt

#删除sed.txt文件的最后一行。

sed '$d' sed.txt

删除sed.txt文件所有包含test的行。

sed '/test/d ' sed.txt

删除sed.txt文件所有包含字母的行。

sed '/[A-Za-z]/d ' sed.txt

2、整行替换：c命令

#将第二行替换成hello world

sed '2c hello world' sed.txt

3、字符串替换：s命令

## 如果没有g标记，则只有每行第一个匹配的hello被替换成hi。

sed 's/hello/hi/g' sed.txt

## 此种写法表示只替换每行的第2个hello为hi

sed 's/hello/hi/2' sed.txt

## 此种写法表示只替换每行的第2个以后的hello为hi（包括第2个）

sed 's/hello/hi/2g' sed.txt

## -n选项和p表示只打印那些发生替换的行。如果某一行开头的hello被替换成hi就打印它。

sed -n 's/^hello/hi/p' sed.txt

## 打印输出sed.txt中的第2行和第4行

sed -n '2,4p' sed.txt

## &符号表示追加一个串到找到的串后。所有以192.168.0.1开头的行都会被替换成它自已加 -localhost，变成192.168.0.1-localhost。第三句表示给IP地址添加中括号

sed -n 's/hello/&-hi/gp' sed.txt

sed 's/^192.168.0.1/&-localhost/' sed.txt

sed 's/^192.168.0.1/[&]/' sed.txt

## liu被标记为\1，所以liu会被保留下来（\1 == liu）

## ling被标记为\2，所以ling也会被保留下来（\2 == ling）

## 所以最后的结果就是\1tao\2ss == "liu" + "tao" + "ling" + "ss"

此处切记：\1代表的是被第一个()包含的内容，\1代表的是被第一个()包含的内容，……

上面命令的意思就是：被括号包含的字符串会保留下来，然后跟其他的字符串比如tao和ss组成新的字符串liutaolingss

sed -n 's/$liu$jialing/\1tao/p' sed.txt

sed -n 's/$liu$jia$ling$/\1tao\2ss/p' sed.txt

## 不论什么字符，紧跟着s命令的都被认为是新的分隔符，所以，"#"在这里是分隔符，代替了默认的"/"分隔符。表示把所有hello替换成hi。

sed 's#hello#hi#g' sed.txt

## 所有在模板today和hello所确定的范围内的行都被打印。都找第一个，也就是说，从第一个today到第一个hello

sed -n '/today/,/hello/p' sed.txt

## 打印从第五行开始到第一个包含以hello开始的行之间的所有行。

sed -n '5,/^hello/p' sed.txt

sed -n '/^hello/,8p' sed.txt

## 对于模板today和hello之间的行，每行的末尾用字符串www替换。

sed '/today/,/hello/s/$/www/' sed.txt

## 对于模板today和hello之间的行，每行的开头用字符串www替换。

sed '/today/,/hello/s/^/www/' sed.txt

## 将以字母开头的行中的数字5替换成five

sed '/^[A-Za-z]/s/5/five/g' sed.txt

4、多点编辑：e命令

## -e允许在同一行里执行多条命令。

## 如例子所示，第一条命令删除1至5行，第二条命令用hello替换hi。

## 命令的执行顺序对结果有影响。如果两个命令都是替换命令，那么第一个替换命令将影响第二个替换命令的结果。

sed -e '1,5d' -e 's/hello/hi/' sed.txt

## 一个比-e更好的命令是--expression。它能给sed表达式赋值。

sed --expression='s/hello/hi/' --expression='/today/d' sed.txt

5、从文件读入：r命令

## file里的内容被读进来，显示在与hello匹配的行下面，如果匹配多行，则file的内容将显示在所有匹配行的下面。

sed '/hello/r file' sed.txt

6、写入文件：w命令

## 在huangbo.txt中所有包含hello的行都被写入file里。

sed -n '/hello/w file' sed.txt

7、追加命令：a命令

## '--->this is a example'被追加到以hello开头的行(另起一行)后面，sed要求命令a后面有一个反斜杠。

sed '/^hello/a\\--->this is a example' sed.txt

8、插入：i命令

## 如果test被匹配，则把反斜杠后面的文本插入到匹配行的前面。

sed '/test/i\\some thing new -------------------------' sed.txt

9、下一个：n命令

## 如果hello被匹配，则移动到匹配行的下一行，替换这一行的aa，变为bb，并打印该行

## 替换下一行的第一个aa

sed '/hello/{n; s/aa/bb/;}' sed.txt

## 替换下一行的全部aa

sed '/hello/{n; s/aa/bb/g;}' sed.txt

10、退出：q命令

sed '10q' sed.txt

## 打印完第10行后，退出sed。

## 同样的写法：

sed -n '1,10p ' sed.txt

2.7.awk（报表生成器）

Awk是一个强大的处理文本的编程语言工具，其名称得自于它的创始人Alfred Aho、Peter Weinberger和Brian Kernighan 姓氏的首个字母，相对于grep的查找，sed的编辑，awk在其对数据分析并生成报告时，显得尤为强大。AWK 提供了极其强大的功能：可以进行样式装入、流控制、数学运算符、进程控制语句甚至于内置的变量和函数。简单来说awk就是扫描文件中的每一行，查找与命令行中所给定内容相匹配的模式。如果发现匹配内容，则进行下一个编程步骤。如果找不到匹配内容，则继续处理下一行。

1、假设last -n 5的输出如下:

[root@localhost ~]# last -n 5

root pts/0 192.168.123.1 Wed Dec 28 01:55 still logged in

reboot system boot 2.6.32-573.el6.x Tue Dec 27 04:25 - 03:11 (22:46)

root pts/1 192.168.123.1 Tue Dec 27 02:00 - 02:00 (00:00)

root pts/1 192.168.123.1 Tue Dec 27 01:59 - 02:00 (00:00)

root pts/0 192.168.123.1 Tue Dec 27 01:59 - down (00:16)

2、只显示五个最近登录的账号：

[root@localhost ~]# last -n 5 | awk '{print $1}'

root

reboot

root

awk工作流程是这样的：读入有'\n'换行符分割的一条记录，然后将记录按指定的域分隔符划分域，填充域，$0则表示所有域,$1表示第一个域,$n表示第n个域。默认域分隔符是"空白键" 或 "[tab]键",所以$1表示登录用户，$3表示登录用户ip,以此类推

3、显示/etc/passwd的账户：

[root@localhost ~]# cat /etc/passwd |awk -F ':' '{print $1}'

root

bin

daemon

adm

这种是awk+action的示例，每行都会执行action{print $1}。-F指定域分隔符为':'

4、显示/etc/passwd的账户和账户对应的shell,而账户与shell之间以tab键分割

[root@localhost ~]# cat /etc/passwd |awk -F ':' '{print $1"\t"$7}'

root /bin/bash

bin /sbin/nologin

daemon /sbin/nologin

adm /sbin/nologin

lp /sbin/nologin

5、BEGIN and END 关键字

如果只是显示/etc/passwd的账户和账户对应的shell,而账户与shell之间以逗号分割,而且在所有行添加列名name,shell,在最后一行添加"blue,/bin/nosh"。

cat /etc/passwd |awk -F ':' 'BEGIN {print "name,shell"} {print $1","$7} END {print "blue,/bin/nosh"}'

cat /etc/passwd | awk -F ':' 'BEGIN {print "name \t shell"} {print$1"\t"$7} END {print "blue,/bin/bash"}'

name,shell

root,/bin/bash

daemon,/bin/sh

....

blue,/bin/nosh

awk工作流程是这样的：先执行BEGIN，然后读取文件，读入有/n换行符分割的一条记录，然后将记录按指定的域分隔符划分域，填充域，$0则表示所有域,$1表示第一个域,$n表示第n个域,随后开始执行模式所对应的动作action。接着开始读入第二条记录••••••直到所有的记录都读完，最后执行END操作。

6、搜索/etc/passwd有root关键字的所有行

awk -F: '/root/' /etc/passwd

root:x:0:0:root:/root:/bin/bash

这种是pattern的使用示例，匹配了pattern(这里是root)的行才会执行action(没有指定action，默认输出每行的内容)。

搜索支持正则，例如找root开头的: awk -F: '/^root/' /etc/passwd

搜索/etc/passwd有root关键字的所有行，并显示对应的shell

awk -F ':' '/root/{print $7}' /etc/passwd

/bin/bash

这里指定了action{print $7}

6、awk常见内置变量

FILENAME：awk浏览的文件名

FNR：浏览文件的记录数，也就是行数。awk是以行为单位处理的，所以每行就是一个记录

NR：awk读取文件每行内容时的行号

NF：浏览记录的域的个数。可以用它来输出最后一个域

FS：设置输入域分隔符，等价于命令行-F选项

OFS：输出域分隔符

统计/etc/passwd:文件名，每行的行号，每行的列数，对应的完整行内容

awk -F ':' '{print "filename:" FILENAME ",linenumber:" NR ",columns:" NF ",linecontent:"$0}' /etc/passwd

awk -F':' '{print "filename:" FILENAME ",linenumber:" NR ",colums:" NF "linecotent:" $0}' /etc/passwd

filename:/etc/passwd,linenumber:3,columns:7,linecontent:bin:x:2:2:bin:/bin:/bin/sh

filename:/etc/passwd,linenumber:4,columns:7,linecontent:sys:x:3:3:sys:/dev:/bin/sh

使用printf替代print,可以让代码更加简洁，易读

awk -F ':' '{printf("filename:%s,linenumber:%s,columns:%s,linecontent:%s\n",FILENAME,NR,NF,$0)}' /etc/passwd

指定输入分隔符，指定输出分隔符：

awk 'BEGIN {FS=":"; OFS="\t"} {print $1, $2}' /etc/passwd

sshd x

tcpdump x

linux x

8、实用例子

A：打印最后一列：

awk -F: '{print $NF}' /etc/passwd

awk -F: '{printf("%s\n",$NF);}' /etc/passwd

B：统计文件行数：

awk 'BEGIN {x=0} {x++} END {print x}' /etc/passwd

C：打印9*9乘法表：

awk 'BEGIN{for(n=0;n++<9;){for(i=0;i++<n;)printf i"*"n"="i*n" ";print ""}}'

awk 'BEGIN {for(i=1;i<=9;i++){for(j=1;j<=i;j++){printf i"*"j"="i*j" ";}print ""}}'

awk 'BEGIN {for(i=9;i>=1;i--){for(j=i;j>=1;j--){printf i"*"j"="i*j" ";}print ""}}'

D：计算1-100之和：

echo "sum" | awk 'BEGIN {sum=0;} {i=0;while(i<101){sum+=i;i++}} END {print sum}'

9、更多详细用法参见官网：http://www.gnu.org/software/gawk/manual/gawk.html

2.8.find

功能：搜索文件目录层次结构

格式： find path -option actions

find <路径> <选项> [表达式]

常用可选项：

-name 根据文件名查找，支持('* ' , '? ')

-type 根据文件类型查找(f-普通文件，c-字符设备文件，b-块设备文件，l-链接文件，d-目录)

-perm 根据文件的权限查找，比如 755

-user 根据文件拥有者查找

-group 根据文件所属组寻找文件

-size 根据文件小大寻找文件

-o 表达式或

-a 表达式与

-not 表达式非

示例：

## 准备的测试文件

[linux@linux txt]$ ll

total 248

-rw-rw-r--. 1 linux linux 235373 Apr 18 00:10 hw.txt

-rw-rw-r--. 1 linux linux 0 Apr 22 05:43 LINUX.pdf

-rw-rw-r--. 1 linux linux 3 Apr 22 05:50 liujialing.jpg

-rw-rw-r--. 1 linux linux 0 Apr 22 05:43 mingxing.pdf

-rw-rw-r--. 1 linux linux 57 Apr 22 04:40 mingxing.txt

-rw-rw-r--. 1 linux linux 66 Apr 22 05:15 sort.txt

-rw-rw-r--. 1 linux linux 214 Apr 18 10:08 test.txt

-rw-rw-r--. 1 linux linux 24 Apr 22 05:27 uniq.txt

## 查找文件名txt结尾的文件

[linux@linux txt]$ find /home/linux/txt/ -name "*.txt"

/home/linux/txt/uniq.txt

/home/linux/txt/mingxing.txt

/home/linux/txt/test.txt

/home/linux/txt/hw.txt

/home/linux/txt/sort.txt

## 忽略大小写查找文件名包含linux

[linux@linux txt]$ find /home/linux/txt -iname "*linux*"

/home/linux/txt/LINUX.pdf

## 查找文件名结尾是.txt或者.jpg的文件

[linux@linux txt]$ find /home/linux/txt/ $ -name "*.txt" -o -name "*.jpg" $

/home/linux/txt/liujialing.jpg

/home/linux/txt/uniq.txt

/home/linux/txt/mingxing.txt

/home/linux/txt/test.txt

/home/linux/txt/hw.txt

/home/linux/txt/sort.txt

另一种写法：find /home/linux/txt/ -name "*.txt" -o -name "*.jpg"

使用正则表达式的方式去查找上面条件的文件：

[linux@linux txt]$ find /home/linux/txt/ -regex ".*$\.txt\|\.jpg$$"

/home/linux/txt/liujialing.jpg

/home/linux/txt/uniq.txt

/home/linux/txt/mingxing.txt

/home/linux/txt/test.txt

/home/linux/txt/hw.txt

/home/linux/txt/sort.txt

## 查找.jpg结尾的文件，然后删掉

[linux@linux txt]$ find /home/linux/txt -type f -name "*.jpg" -delete

[linux@linux txt]$ ll

total 248

-rw-rw-r--. 1 linux linux 235373 Apr 18 00:10 hw.txt

-rw-rw-r--. 1 linux linux 0 Apr 22 05:43 LINUX.pdf

-rw-rw-r--. 1 linux linux 0 Apr 22 05:43 mingxing.pdf

-rw-rw-r--. 1 linux linux 57 Apr 22 04:40 mingxing.txt

-rw-rw-r--. 1 linux linux 66 Apr 22 05:15 sort.txt

-rw-rw-r--. 1 linux linux 214 Apr 18 10:08 test.txt

-rw-rw-r--. 1 linux linux 24 Apr 22 05:27 uniq.txt

3.Shell 操作字符串

3.1.字符串截取

Linux中操作字符串，也是一项必备的技能。其中尤以截取字符串更加频繁，下面为大家介绍几种常用方式，截取字符串。

1、#截取，删除左边字符串（包括制定的分隔符），保留右边字符串

预先定义一个变量：WEBSITE='http://hadoop//centos/huangbo.html'

[root@hadoop ~]# echo ${WEBSITE##*//}

结果：centos/huangbo.html

2、##截取，删除左边字符串（包括指定的分隔符），保留右边字符串，和上边一个#不同的是，它一直找到最后，而不是像一个#那样找到一个就满足条件退出了。

[root@hadoop ~]# echo ${WEBSITE##*//}

结果：centos/huangbo.html

3、%截取，删除右边字符串（包括制定的分隔符），保留左边字符串

[root@hadoop ~]# echo ${WEBSITE%//*}

结果：http://hadoop

4、%%截取，删除右边字符串（包括指定的分隔符），保留左边字符串，和上边一个%不同的是，它一直找到最前，而不是像一个%那样找到一个就满足条件退出了。

[root@hadoop ~]# echo ${WEBSITE%%//*}

结果：http:

总结以上四种方式：

# 去掉左边，最短匹配模式， ##最长匹配模式。

% 去掉右边，最短匹配模式， %%最长匹配模式

5、从左边第几个字符开始，以及截取的字符的个数

[root@hadoop ~]# echo ${WEBSITE:2:2}

结果：tp

6、从左边第几个字符开始，一直到结束

[root@hadoop ~]# echo ${WEBSITE:2}

结果：tp://hadoop//centos//huangbo.html

7、从右边第几个字符开始，以及字符的个数

[root@hadoop ~]# echo ${WEBSITE:0-4:2}

结果：ht

8、从右边第几个字符开始，一直到结束

[root@hadoop ~]# echo ${WEBSITE:0-4}

结果：html

9、利用awk进行字符串截取

[root@hadoop ~]# echo $WEBSITE | awk '{print substr($1,2,6)}'

结果：ttp://

10、利用cut进行字符串截取

[root@hadoop ~]# echo $WEBSITE | cut -b 1-4

http

[root@hadoop ~]# echo $WEBSITE | cut -c 1-4

http

[root@hadoop ~]# echo $WEBSITE | cut -b 1,4

[root@hadoop ~]# echo $WEBSITE | cut -c 1,4

11、获取最后几个字符

[root@hadoop ~]# echo ${WEBSITE:(-3)}

结果：tml

12、截取从倒数第3个字符后的2个字符

[root@hadoop ~]# echo ${WEBSITE:(-3):2}

结果：tm

3.2.字符串替换

使用格式：${parameter/pattern/string}

例子：

##定义变量VAR：

[linux@linux ~]$ VAR="hello tom, hello kitty, hello xiaoming"

##替换第一个hello：

[linux@linux ~]$ echo ${VAR/hello/hi}

hi tom, hello kitty, hello xiaoming

##替换所有hello：

[linux@linux ~]$ echo ${VAR//hello/hi}

hi tom, hi kitty, hi xiaoming

3.3.获取字符串长度

在此为大家提供五种方式获取某字符串的长度。

1、使用wc -L命令

[root@hadoop ~]# echo ${WEBSITE} |wc -L

2、使用expr的方式去计算

[root@hadoop ~]# expr length ${WEBSITE}

3、通过awk + length的方式获取字符串长度

[root@hadoop ~]# echo ${WEBSITE} | awk '{print length($0)}'

4、通过awk的方式计算以""分隔的字段个数

[root@hadoop ~]# echo ${WEBSITE} |awk -F "" '{print NF}'

5、通过#的方式获取字符串（最简单，最常用）

[root@hadoop ~]# echo ${#WEBSITE}

4. Shell脚本自动安装MySQL

安装mysql脚本：

#!/bin/bash

## auto install mysql

## 假如是第二次装，那么要先停掉服务，并且卸载之前的mysql

service mysql stop

EXISTS_RPMS=`rpm -qa | grep -i mysql`

echo ${EXISTS_RPMS}

for RPM in ${EXISTS_RPMS}

rpm -e --nodeps ${RPM}

done

## 删除残留文件

rm -fr /usr/lib/mysql

rm -fr /usr/include/mysql

rm -f /etc/my.cnf

rm -fr /var/lib/mysql

## 从服务器获取安装mysql的rpm包

wget http://linux/soft/MySQL-client-5.6.26-1.linux_glibc2.5.x86_64.rpm

wget http://linux/soft/MySQL-server-5.6.26-1.linux_glibc2.5.x86_64.rpm

## 删除之前的密码文件，以免产生干扰

rm -rf /root/.mysql_secret

## 安装服务器

rpm -ivh MySQL-server-5.6.26-1.linux_glibc2.5.x86_64.rpm

## 获取到生成的随机密码

##PSWD=`cat /root/.mysql_secret | awk -F ':' '{print substr($4,2,16)}'`

PSWD=` grep -v '^$' /root/.mysql_secret | awk -F ':' '{print substr($4,2,16)}'`

##PSWD=${PWD:1:16}

## 安装客户端

rpm -ivh MySQL-client-5.6.26-1.linux_glibc2.5.x86_64.rpm

## 然后删除刚刚下下来的rpm包

rm -rf MySQL-client-5.6.26-1.linux_glibc2.5.x86_64.rpm

rm -rf MySQL-server-5.6.26-1.linux_glibc2.5.x86_64.rpm

## 提示安装的步骤都完成了。

echo "install mysql server and client is done .!!!!!!"

## 打印出来刚刚生成的mysql初始密码

echo "random password is:${PSWD}"

## 开启mysql服务

service mysql start

手动第一次登陆，然后改掉密码：

[root@hadoop bin]# mysql -uroot -pZjVIWvOGD18bT7oX

mysql> set PASSWORD=PASSWORD('root');

现在就可以写脚本链接mysql进行操作了

[root@hadoop bin]# vi initMysql.sh

#!/bin/bash

mysql -uroot -proot << EOF

GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'root' WITH GRANT OPTION;

FLUSH PRIVILEGES;

use mysql;

select host, user, password from user;

EOF

编程有了模型

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linux之Shell 操作实用技巧

目录1.Shell 操作日期时间1.1. 显示系统当前日期时间1.2.设置系统日期时间1.3.日期计算1.4.自定义日期格式1.5. 有用小技巧2.高级文本处理命令2.1.wc2.2.sort2.3.uniq2.4.cut2.5.grep（文本生成器）2.6.sed（流编辑器）2.7.awk（报表生成器）2.8.find3.Shell...
复制链接

扫一扫