一个查找的问题

一个查找的问题 题目大概是这样的:一个文件保存有100亿条连接请求记录(IP, 时间,按照时间排序)如果同一个IP地址10秒内有两次或以上的连接请求,那么则视其为攻击。问如何找出这些IP。比如下面的数据,应该找出 202.118.1.98

202.118.1.98 2009-01-01 12:34:56.1234

202.118.2.98 2009-01-01 12:34:56.2234

202.118.3.98 2009-01-01 12:34:56.3234

202.118.4.98 2009-01-01 12:34:56.4234

202.118.1.98 2009-01-01 12:34:56.5234

202.118.2.98 2009-01-01 12:35:56.1234

 

我的解法:

1.用一个循环链表来保存读入的记录,直到第一个读入的记录和最后一个读入的记录的时间差等于或者大于10秒,创建一个单链表链表(用来保存输出结果)

2.用第一个记录的IP在循环链表表里查找,如果没有找到,删除第一条记录,然后继续读入数据,直到第一个记录和最后一个记录 的时间差大于或者等于10秒。 如果找到同一个IP地址10秒内有两次或以上的连接请求,那么将这个IP存放到结果单链表中(存之前,先查询是否已经存在,若果已经存在,则不保存)。 接着删除第一条记录,然后继续读入数据,直到第一个记录和最后一个记录的时间差大于或者等于10秒。

3.重复步骤2,直到不再有数据读入.

4.输出结果 这样的解法有看起来比较费时间的地方就是去掉结果中的重复记录,但是正常情况下,攻击性质的连接应该是很少的,所以这样操作不会有很明显的影响。

 

不知道有没有更加好的办法,望不吝赐教。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值