1 cut(剪)
基本用法:cut [选项参数] filename
选项参数 | 功能 |
-f | 列号,提取第几列 |
-d | 分隔符,按照指定分隔符分割列 |
案例:选取系统PATH变量值,第2个“:”开始后的所有路径:
[yege@hadoop101 datas]$ echo $PATH
/usr/lib64/qt-3.3/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/atguigu/bin
[yege@hadoop102 datas]$ echo $PATH | cut -d: -f 2-
/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/atguigu/bin
2,sed
流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。
基本用法:sed [选项参数] ‘command’ filename
- 选项参数说明
选项参数 | 功能 |
-e | 直接在指令列模式上进行sed的动作编辑。 |
2.命令功能描述
命令 | 功能描述 |
a | 新增,a的后面可以接字串,在下一行出现 |
d | 删除 |
s | 查找并替换 |
案例:将sed.txt文件中的第二行删除并将wo替换为ni
sed.txt 文件内容
dong shen
guan zhen
wo wo
lai lai
le le
实现:
[yege@hadoop102 datas]$ sed -e '2d' -e 's/wo/ni/g' sed.txt
3,awk
一个强大的文本分析工具,把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行分析处理。
- 基本用法
awk [选项参数] ‘pattern1{action1} pattern2{action2}...’ filename
pattern:表示AWK在数据中查找的内容,就是匹配模式
action:在找到匹配内容时所执行的一系列命令
2. 选项参数说明
选项参数 | 功能 |
-F | 指定输入文件折分隔符 |
-v | 赋值一个用户定义变量 |
案例:搜索passwd文件以root关键字开头的所有行,并输出该行的第7列
数据准备:
[yege@hadoop102 datas]$ sudo cp /etc/passwd ./
实现:
[yege@hadoop102 datas]$ awk -F: '/^root/{print $7}' passwd
/bin/bash
4,awk的内置变量
变量 | 说明 |
FILENAME | 文件名 |
NR | 已读的记录数 |
NF | 浏览记录的域的个数(切割后,列的个数) |
4 sort
sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出。
- 基本语法
选项 | 说明 |
-n | 依照数值的大小排序 |
-r | 以相反的顺序来排序 |
-t | 设置排序时所用的分隔字符 |
-k | 指定需要排序的列 |
案例:按照“:”分割后的第三列倒序排序。
数据准备
bb:40:5.4
bd:20:4.2
xz:50:2.3
cls:10:3.5
ss:30:1.6
实现:
[yege@hadoop102 datas]$ sort -t : -nrk 3 sort.sh