- 博客(10)
- 资源 (4)
- 收藏
- 关注
转载 十道海量数据处理面试题与十个方法大总结
文章出自于第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。 再详细介绍下此方案:首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到I
2014-09-25 17:06:34 455
转载 寻找热门查询:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。
寻找热门查询:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门),请你统计最热门的10个查询串,要求使用的内存不能超过1G。 虽然有一千万个Query,但是
2014-09-25 17:04:02 2001
转载 Hilbert空间递归演示
Hilbert空间填充曲线在图像采样等方面十分有用关于什么希尔伯特空间填充曲线看这里:http://en.wikipedia.org/wiki/Hilbert_curve程序效果:模拟Hilbert空间填充曲线效果,点击鼠标自动叠加!运行效果截图Hilbert源程序代码:[java] view plaincopy
2014-09-19 21:32:00 711
转载 谁在养鱼?
问题:在一条街上,有5座房子,喷了5种颜色。每个房子里住着不同国籍的人。每个人喝着不同的饮料,抽不同品牌的香烟,养不同的宠物。 1、英国人住红色房子。 2、瑞典人养狗。 3、丹麦人喝茶。 4、绿色房子在白色房子左面。 5、绿色房子主人喝咖啡。 6、抽Pall Mall香烟的人养鸟。 7、黄色房子主人抽Dunhi
2014-09-18 09:14:50 584
转载 有12个球,形状大小一样,有一个重量不一样,只能用天平称3次,找出那个球,应该怎么称?
分三组:每组四个,第一组编号1-4,第二组5-8,第三组9-12. 第一次称:天平左边放第一组,右边放第二组。 A 第一种可能:平衡。则不同的在第三组。 接下来可以在左边放第9、10、11号,右边放1、2、3号三个正常的。 a.如果平衡,则12号是不同的; b.如果左重右轻,则不同的在9、10、11号中,而且比正常球重。再称一次:9放左边,10放右边,如果平衡,则11号是不同的;如果左
2014-09-18 08:41:43 3902
转载 关键字static的作用及关键字const含义
这个简单的问题很少有人能回答完全。在C语言中,关键字static有三个明显的作用:1)在函数体内,一个被声明为静态的变量在这一函数被调用过程中维持其值不变(该变量存放在静态变量区)。2) 在模块内(但在函数体外),一个被声明为静态的变量可以被模块内所用函数访问,但不能被模块外其它函数访问。它是一个本地的全局变量。3) 在模块内,一个被声明为静态的函数只可被这一模块内的其它函
2014-09-15 23:15:31 1081
转载 SQL删除重复数据只保留一条
用SQL语句,删除掉重复项只保留一条在几千条记录里,存在着些相同的记录,如何能用SQL语句,删除掉重复的呢1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断 select * from people where peopleId in (select peopleId from people group by peopleId havi
2014-09-13 20:06:33 435
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人