- 博客(7)
- 收藏
- 关注
转载 海量数据处理面试题
第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大 的几
2014-05-25 15:09:07 291
转载 数据库中索引的作用
为什么要创建索引呢?这是因为,创建索引可以大大提高系统的性能。 第一,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。 第二,可以大大加快 数据的检索速度,这也是创建索引的最主要的原因。 第三,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。 第四,在使用分组和排序 子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。 第五,通过使用索引
2014-05-25 15:07:06 1346
转载 平衡二叉树的好处
二叉排序树是一种比较有用的折衷方案。 数组的搜索比较方便,可以直接用下标,但删除或者插入某些元素就比较麻烦。 链表与之相反,删除和插入元素很快,但查找很慢。 二叉排序树就既有链表的好处,也有数组的好处。 在处理大批量的动态的数据是比较有用。 文件系统和数据库系统一般都采用树(特别是B树)的数据结构数据,主要为排序和检索的效率。二叉树是一种最基本最
2014-05-25 15:04:52 5928 1
转载 内存对齐的规则以及作用
2 //程序1 3 #include iostream> 4 5 using namespace std; 6 7 struct st1 8 { 9 char a ;10 int b ;11 short c ;12 };13 14 struct st215 {16 short c ;17 c
2014-05-25 15:00:03 371
原创 String reorder
Time Limit: 10000msCase Time Limit: 1000msMemory Limit: 256MBDescriptionFor this question, your program is required to process an input string containing only ASCII characters
2014-04-15 18:37:11 332
原创 dictionary order
Time Limit: 10000msCase Time Limit: 1000msMemory Limit: 256MBDescriptionConsider a string set that each of them consists of {0, 1} only. All strings in the set have the same nu
2014-04-15 18:33:52 406
原创 decreases inversion count
#include #include using namespace std;void swap(int &a,int &b){int temp = a;a = b;b = temp;}//计算反演对的个数int InversionCount(int* arr,int** inversion,const int n){assert(!(arr=
2014-04-15 18:30:35 359
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人