- 博客(1)
- 收藏
- 关注
转载 十道海量数据处理面试题
1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章:十一、从头到尾彻底解析Hash表算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。 再
2011-10-16 11:46:46 145
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
至于别人笑不笑自己嘛,那是别人的事,只要自己首先不笑自己就行了,这才是最重要的。
1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章:十一、从头到尾彻底解析Hash表算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。 再
2011-10-16 11:46:46 145
TA创建的收藏夹 TA关注的收藏夹
TA关注的人