监控日志统计IP次数

 1 #监控服务器日志,找出每分钟访问超过100次的ip地址。
 2 
 3 #1、每分钟读取一次文件,获取文件内容
 4 #2、从文件内容里面找到ip地址
 5 #3、判断每个ip出现的次数,如果超过100次,就找出来
 6 import  time
 7 point=0
 8 while True:
 9     ips={}  #定义字典,用于存放IP和次数
10     f=open("access.log",encoding="utf-8")
11     f.seek(point) #指针移动到上次统计的位置
12     for i in f: #通过for来逐行读取文件的内容
13         if i.strip()!='':    #判断是否是空行
14             ip=i.split()[0]
15             if ip not in ips.keys():
16                 ips.setdefault(ip,1)
17             else:
18                 ips[ip]+=1
19     point=f.tell()  #获取当前文件读的位置
20     for k,v in ips.items():  #遍历字典中所有的IP,并输出次数大于100次的IP
21         if v>100:
22             print("%s超过100次"%k)
23     f.close() #关闭文件
24     time.sleep(60)

备注:

1、为什么用字典不用list存放IP进行统计

答:如果用list每个IP存入数组,当IP较多,数组就会特别大,占内容,且遍历性能较弱,用字典每个IP 对应一个次数,节省内存,遍历性能较高

2、除了监控日志,还可以通过该段代码进行做其他的统计工作,比如一个文件中某个人物出现次数等

3、文件读取用for i in f 的方式,这样每次读取一行,占内存较小,如果用readlines,是每次把文件所有内容取出,这样较占内存

 

其他应用变异,比如统计一遍文章人物名称出现的次数,代码如下:

1 dic={"董卓":0,"貂蝉":0,"吕布":0,"孙坚":0} #人物初始值
2 with open("sanguo.txt",encoding="utf-8") as f:  #with这种方式不需关闭文件
3     for i in f: #逐行遍历文件
4         for k in dic.keys(): #遍历字典人物
5             num=i.count(k) #统计当前行人物个数
6             dic[k]+=num  #更新人物个数值
7     print(dic) #输出字典

 

转载于:https://www.cnblogs.com/xiaokuangnvhai/p/10930483.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值