使用Linux常用文本处理命令统计日志文件中访问量最大的十个IP地址

目录

一. 统计日志文件中访问量最大的十个IP地址

二.sort命令:把整理过的文本排序显示在屏幕上,不改变原始文件

1.sort -n :按照数字大小进行排序

2.sort -r:反向排序

3.sort -u:等同于uniq,相同的数据仅显示一行

4.sort -t: 指定字段分隔符,默认使用[Tab]键分隔

5.sort -k:指定排序字段

6.sort -o:将结果转存到指定文件

三.uniq命令:去重

1.uniq -c:统计连续行重复的次数,删除重复行

1.1 统计重复行出现的次数

2.uniq -d :仅显示连续重复的行

3.uniq -u: 仅显示没有连续的出现一次的行,可以使用sort来解决

四.tr命令:字符替换、压缩和删除

1.tr -t:转换(大小写、字符)

1.1 所有小写转换为大写

1.2 a转换成A

1.3 将.转换成空格

2.tr -c:保留字符集1的字符,其他的字符用字符集2替换

3.tr -d:删除字符

4.tr -s: 将重复出现的字符串压缩为一个字符串,也可以替换

4.1 压缩替换

4.2 删除空行:grep -v 或者 tr -s

五.cut命令:可以提取文本文件数据的指定部分

六.split命令:拆分


一. 统计日志文件中访问量最大的十个IP地址

cat access_log |cut -d " " -f1|sort -n|uniq -c|sort -rn|head

思路:

  1. 先在日志文件中将IP地址提取出来(cut -d)
  2. 按数字排序,将相同地址整理在一起(sort -n)
  3. 去掉重复的地址,并统计重复地址出现的重复次数(uniq -c)
  4. 排序(sort -rn)后查看前十个(head)

cat  :查看日志文件

日志文件  :access_log

cut -d " " -f1  :以'' "作为分隔的条件,取文件的第一列

sort -n  :按数字大小整理排序

uniq -c   :统计相邻的行的重复数量

sort -rn  :反方向(由上至下)按数字大小整理排序

head  :默认查看开头十行

二.sort命令:把整理过的文本排序显示在屏幕上,不改变原始文件

以行为单位对文件内容进行排序,也可以根据不同的数据类型来排序,比较原则是从首字符向后,依次按AscII码值进行比较,最后将他们按升序输出。

常用选项:

选项作用
-n按照数字大小进行排序
-r反向排序
-R随机排序
-u等同于uniq,表示相同的数据仅显示一行
-t指定字段分隔符,默认使用[Tab]键分隔
-k指定列
-o<输出文件>将排序后的结果转存至指定文件
-f忽略大小写,会将小写字母都转换为大写字母来进行比较
-b忽略每行前面的空格

1.sort -n :按照数字大小进行排序

  

2.sort -r:反向排序

3.sort -u:等同于uniq,相同的数据仅显示一行

4.sort -t: 指定字段分隔符,默认使用[Tab]键分隔

5.sort -k:指定排序字段

6.sort -o:将结果转存到指定文件

三.uniq命令:去重

uniq命令用于报告或者忽略文件中连续的重复行,常和sort 命令一起配合使用

常用选项:

选项作用
-c进行计数,并删除文件中重复出现的行
-d仅显示连续的重复行
-u仅显示出现一次的行

1.uniq -c:统计连续行重复的次数,删除重复行

1.1 统计重复行出现的次数

2.uniq -d :仅显示连续重复的行

3.uniq -u: 仅显示没有连续的出现一次的行,可以使用sort来解决

四.tr命令:字符替换、压缩和删除

基本功能转换,常用来对来自标准输入的字符进行替换、压缩和删除

格式:

tr [选项] [字符集1] [字符集2]

常用选项:

选项作用
-c

保留字符集1的字符,其他的字符(包括换行符\n)用字符集2替换

-d删除所有属于字符集1的字符
-s将重复出现的字符串压缩为一个字符串;用字符集2替换字符集1
-t字符集2替换字符集1,与不加选项-t结果相同

参数:

参数作用
字符集1指定要转换或删除的原字符集。

当执行转换操作时,必须使用参数"字符集2"指定转换的目标字符集合,但执行删除操作时,不需要参数”字符集2“

字符集2

指定要转换成的目标字符集

1.tr -t:转换(大小写、字符)

1.1 所有小写转换为大写

1.2 a转换成A

1.3 将.转换成空格

2.tr -c:保留字符集1的字符,其他的字符用字符集2替换

3.tr -d:删除字符

4.tr -s: 将重复出现的字符串压缩为一个字符串,也可以替换

4.1 压缩替换

4.2 删除空行:grep -v 或者 tr -s

五.cut命令:可以提取文本文件数据的指定部分

常用选项:

选项说明
-b以字节为单位进行分割 ,仅显示行中指定直接范围的内容
-d自定义分隔符,默认为制表符”TAB”
-f显示指定字段的内容 , 与-d一起使用 ( -指定连续字段 ,指定不连续字段)
-n取消分割多字节字符
--complement排除所指定的字段
--output-delimiter更改输出内容的分隔符

六.split命令:拆分

将一个大的文件拆分成若干个小文件

常用选项:

选项作用
-l以行数拆分
-b以大小拆分

  • 4
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小啄学习日记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值