记——Linux系统管理文本处理简述

文本处理

sort 排序命令:

常用选项说明
-r反转排序
-t指定分隔符
-k用于指定对哪一个字段进行排序
-n按照数字排序

tr 命令:

tr [option]...SET1 [SET2]

可以用来删除一段文本信息中的某些文字。或者将其进行转换。

常用选项说明
-d删除和set1匹配的字符,注意不是全词匹配也不是按字符顺序匹配
-s去除set1指定的在输入文本中连续并重复的字符

join命令

join [option]... file1 file2

将每个文件中栏位(也就是第一列)相等的那些行的数据连接起来。

常用选项说明
-t指定分隔符,默认为空格
-i忽略大小写的差异
-1指明第一个文件要用哪个字段来对比,默认对比第一个字段
-2指明第二个文件要用哪个字段来对比,默认对比第一个字段

grep模式匹配命令:

常用选项说明
-n显示匹配文本所在行的行号
-i忽略大小写
-v反选,输出不匹配行的内容
-c统计以模式匹配的数目
-r递归匹配查找
-E过滤筛选条件

^放到中括号内为排除字符,否则表示行首。

Cut 字符截取命令:

Cut 字段提取命令:一般与grep 命令一起使用 默认以tab键为分割

常用选项说明
-f列号: 提取第几列
-d分割符: 按照指定分割符分割列(只能识别tab键或具体的分割符)

Sed命令(处理行):

流编辑器(支持管道操作) 对数据选取、替换、删除、新增

Sed [选项] ‘[动作]’ 文件名

允许多个条件同时执行用 ; 连接

常用选项说明
-n只输出经过处理的行
-e执行多条命令
-i直接修改文件
常用动作说明
d删除行数据
p输出
s替换字符串 格式 :‘行范围s/旧字符串/新字符串/g’
g整行操作
c替换整行数据
a在后追加整行数据
i在之前插入整行数据

Awk命令(处理列):

awk‘条件1 {动作1} 条件2 {动作2}...’ 文件名

条件:一般使用关系表达式作为条件(>、<、=
动作:格式化输出、流程控制语句

$列号:选取第几列

Awk处理数据是先读入一行数据,在判断符合条件的数据
Print只在awk中使用,并在最后自动添加换行符
Printf可以awk和系统中使用,不自动加入换行符

  • 后记:
    有需要的朋友可以搜索微信公众号:【知音库
    这里有个人总结的文章,本人是大数据专业学生,
    同时也是为了鼓励自己,坚持写笔记,希望可以共同进步。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值