Linux基础入门(五)--学习笔记-历史命令

13 篇文章 0 订阅
9 篇文章 0 订阅

介绍

在linux中,对于文本的处理和分析是极为重要的,现在有一个文件叫做data1,同学们可以在这里下载,

wget http://labfile.oss.aliyuncs.com/courses/1/data1

里面记录是一些命令的记录,现在需要你从里面找出出现频率次数前3的命令并保存在/home/shiyanlou/result。

目标

处理文本data
将结果写入result
结果包含次数和命令,如“100 ls”
提示

cut截取(-c 8- 明白含义吗)
uniq -dc去重
sort 的参数选择-k1 -n -r
答案类似于

cat data|....|....|....   >  /home/shiyanlou/result

来源

2016年百度校招面试题

这题把前两天学的东西都涵盖了,于是乎就又学习了一下前面的知识。
还是一脸蒙逼,参考了网上的两个答案,居然发现有两个版本
首先下载数据库,这个没有问题:
下面看下两个答案
第一个:

cat data1| cut -c 8-| cut -d ' ' -f 1| sort | uniq -dc| sort -t ' ' -k1 -n -r| head -3 > /home/shiyanlou/result

第二个:

cat data1| cut -c 8-| sort | uniq -dc| sort -t ' ' -k1 -n -r| head -n -3 > /home/shiyanlou/result

首先解析一下 cut -c 8- , 这个是 cut 命令,参数 -c 8- 表示从 第8 字符开始到最后,注意一下cut 的主要参数:
主要参数
-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。
-n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的
范围之内,该字符将被写出;否则,该字符将被排除。
至于为什么是 8- ,cat data1 数了一下命令开始位置正好是第8位。

然后第一个答案比第二个答案多了一个 cut -d ’ ’ -f 1, 这里涉及到了cut 的另外一个命令,以空格为分隔符,选取第一个域,这样,第一个命令和其他的路径等分开了。这种答案也就是指考虑第一个命令,后面的差异不管。

然后就是 sort | uniq -dc 这里涉及到两个命令, uniq命令可以去除排序过的文件中的重复行,因此uniq经常和sort合用。也就是说,为了使uniq起作用,所有的重复行必须是相邻的。前两天偷懒,没有做笔记,下面是uniq命令的介绍(借鉴博客:linux sort,uniq,cut ,wc 命令

uniq[-icu]
-i:忽略大小写字符的不同;
-c:进行计数
-u:只显示唯一的行

testfile的内容如下:
hello
world
friend
hello
world
hello

使用uniq 去重,没有效果:
uniq testfile
hello
world
friend
hello
world
hello

排序文件,默认是去重
cat words | sort |uniq
friend
hello
world

排序之后删除了重复行,同时在行首位置输出该行重复的次数
sort testfile | uniq -c
1 friend
3 hello
2 world

仅显示存在重复的行,并在行首显示该行重复的次数
sort testfile | uniq -dc
3 hello
2 world

仅显示不重复的行
sort testfile | uniq -u
friend

然后就是 sort -t ’ ’ -k1 -n -r 这个就是重新根据去重后的数量排序的命令。参数的具体含义是-k 1 按照第一个区域排序, -n 使用纯数字排序,-r 是反向排序。
其余命令如下:

选项参数
-f忽略大小写的差异,例如 A 与 a 视为编码相同
-b忽略最前面的空格符部分
-M以月份的名字来排序,例如 JAN, DEC 等等的排序方法
-n使用『纯数字』进行排序(默认是以文字型态来排序的)
-r反向排序
-u就是 uniq ,相同的数据中,仅出现一行代表
-t分隔符,默认是用 [tab] 键来分隔
-k以那个区间 (field) 来进行排序的意思

最后 head -n -3 或者 head -3 输出前三个,貌似不加-n 的参数影响不大。通过’>’ 从输出端 重定向到 文件 /home/shiyanlou/result

如果从整体上,所有命令的角度考虑,第二个答案是对的,也是实验可以通过的,如果只是考虑第一个命令,那第一种答案是对的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值