面试归档
文章平均质量分 79
zengzelin
这个作者很懒,什么都没留下…
展开
-
bigdata
第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率转载 2015-07-28 14:23:53 · 492 阅读 · 0 评论 -
几种常见排序算法
1、冒泡排序 非递归实现 void bubbleSort(int *array,int len) { int tmp; bool flag; for (int i= len-1; i > 0; i--) { flag = false; for (int j = 0; j if (array[j] >原创 2015-06-23 13:24:06 · 583 阅读 · 0 评论 -
关于网络编程select小结
描述符读就绪情况: 1)套接字的读缓冲大于低位标记SO_RECVNOWAT(默认为1) 2) 监听套接字监听到新的连接 3) 套接字接收到了FIN信号,read=0. 4) 套接字出错,read = -1 描述符写就绪情况: 1)套接字的写缓冲大于低位标记SO_SENDNOWAT(默认为2048) 2) 套接字接收到了FIN信号,write=-1,errno= sigpi原创 2015-07-21 14:50:19 · 376 阅读 · 0 评论