有30万条IP段记录,每条记录有startip和endip,给100万个IP如何快速查询所属IP段?然后统计每个段占多少个IP ?
一朋友提出的问题,据说可以 500w/s的查询速度。请讨论!
另一朋友的想法
创建个对象,就叫collection吧,这个对象包含三个成员变量,int size,long startIP, long endIP,提供get和set方法,之后在main方法里将100w的IP处理成long,并放入一个long类型数组里,并排序好,之后再创建个长度为30w的collection类型的数组,将30w的IP段存入数组中,按endIP排序
之后就开始遍历100w的数组,比较long类型数组里每个元素是在30w长度的数组的哪个段里,通过与startIp和endIp比较,有一个落在某个IP段,那么某个collection的size加1
今天想到,如查保证了每个IP段不重叠,可以使用IP段的首地址生成的大整数,生成查找树,对一个来的IP,计算它的大整数值,然后在查找树里查一下就可以知道它是属于哪个IP段的了。