记——Linux系统管理文本处理简述

最新推荐文章于 2022-04-11 21:45:00 发布

Rantele

最新推荐文章于 2022-04-11 21:45:00 发布

阅读量93

点赞数

分类专栏： Linux 文章标签：文本处理

本文链接：https://blog.csdn.net/weixin_43832502/article/details/90083166

版权

8 篇文章 0 订阅

订阅专栏

sort 排序命令:

tr 命令:

tr [option]...SET1 [SET2]

可以用来删除一段文本信息中的某些文字。或者将其进行转换。

常用选项	说明
`-d`	删除和set1匹配的字符，注意不是全词匹配也不是按字符顺序匹配
`-s`	去除set1指定的在输入文本中连续并重复的字符

join命令

join [option]... file1 file2

将每个文件中栏位（也就是第一列）相等的那些行的数据连接起来。

常用选项	说明
`-t`	指定分隔符，默认为空格
`-i`	忽略大小写的差异
`-1`	指明第一个文件要用哪个字段来对比，默认对比第一个字段
`-2`	指明第二个文件要用哪个字段来对比，默认对比第一个字段

grep模式匹配命令:

当^放到中括号内为排除字符，否则表示行首。

Cut 字符截取命令：

Cut 字段提取命令：一般与grep 命令一起使用默认以tab键为分割

常用选项	说明
`-f`	列号：提取第几列
`-d`	分割符：按照指定分割符分割列（只能识别tab键或具体的分割符）

Sed命令（处理行）：

流编辑器（支持管道操作）对数据选取、替换、删除、新增

Sed [选项] ‘[动作]’ 文件名

允许多个条件同时执行用 ; 连接

Awk命令（处理列）:

awk‘条件1 {动作1} 条件2 {动作2}...’ 文件名

条件：一般使用关系表达式作为条件（>、<、=
动作：格式化输出、流程控制语句

$列号：选取第几列

Awk处理数据是先读入一行数据，在判断符合条件的数据
Print只在awk中使用，并在最后自动添加换行符
Printf可以awk和系统中使用，不自动加入换行符

后记：
有需要的朋友可以搜索微信公众号：【知音库】
这里有个人总结的文章，本人是大数据专业学生，
同时也是为了鼓励自己，坚持写笔记，希望可以共同进步。

关注