十一、数据提取操作
- 了解Linux系统中数据提取常用命令
- 结合多个命令,提取目标数据
- 了解正则表达式,使用正则表达式匹配关键词
- 初识Linux三剑客
命令 | 功能 | 命令 | 功能 |
---|---|---|---|
cut | 切分 | grep | 检索 |
sort | 排序 | wc | 统计字符、字数、行数 |
uniq | 去重 | tee | 双向重定向 |
split | 文件切分 | xargs | 参数代换 |
tr | 替换、压缩和删除 |
1.cut:切分
-
以c字符分割:-d c【直接单个使用会报错】
-
显示num字段的内容【n-;n-m;-m;m,n】:-f num
-
字节:-b num
-
字符:-c num
2.sort:按列排序
-
忽略大小写:-f
-
以月份名称排序:-M
-
根据数值进行排序:-n
-
反向排序:-r
-
uniq:-u
-
检查文件是否有序:-c
-
分隔字符:指定排序时用的栏位分隔字符:-t
-
以哪个区间排序:-k
-
排序栏位,第一栏为0,按顺序优先排序:+
3.wc:统计字符、字数、行数
- 仅列出行号:-l
- 仅列出多少字:-w
- 仅列出多少字符:-m
- 列出多少字节:-c
- 列出最长一行的字符长度:-L
4.uniq:行记录去重
- 忽略大小写字符的不同:-i
- 进行计数:-c
- 只输出无重复的行:-u
5.tee:双向重定向
- tee [-a] file
- append:-a
6.split:文件切分
-
切分为SIZE bytes大小的文件:-b SIZE
-
切分为SIZE bytes大小的文件,不断开一行:-C SIZE
-
以num行为大小切分:-l num
7.xargs:参数代换
- 当xargs读到EOF时停止:-eEOF
- 执行指令前询问:-p
- 每次执行command时需要的参数个数:-n num
8.tr:对标准输入的字符替换、压缩、删除
- tr [-cdst] <字符集> <字符集>
- 取代所有不属于第一字符集的字符:-c
- 删除所有属于第一字符集的字符:-d
- 将连续重复的字符以单独一个字符表示:-s
- 先删除第一个字符集较第二字符集多出的字符:-t