- 博客(5)
- 资源 (7)
- 收藏
- 关注
原创 倒排索引
倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(inverted file)。现在这里有三个英文文件:file1(sort,hello....)file2
2017-04-26 13:50:24 400
原创 大数据处理题型分析
大数据处理,顾名思义,数据量非常大,有些可以一次处理,有些需要分割后对其进行处理。解决这类题型的第一点就是要算出其所需空间的大小;1.给定100亿个整数,设计算法找到只出现一次的整数;解题思路:有100亿个整数,一个整数4字节,共所占空间:100亿*4字节 = 10G*4 = 40G;所有整数的范围为0到42亿9千万;需要找到只出现一次的整数,那么我们就可以直接断定一个数出现的状态就有
2017-04-25 15:43:42 976
原创 位图和哈希切分的大数据处理
位图是一个数组的每个数据的每个二进制位表示一个数据,0表示数据不存在,1表示数据存在;在现实生活中,大数据的处理十分的常见;比如说,给40亿个不重复的无符号整数,没排过序,如何快速判断一个数是否在这40亿个数中?要解决这个问题,我们首先想到的是先排序,在进行二分查找,很容易就可以判断成功。但是排序并不好排,40亿个数据,让我们来算一算需要多少的内存,40亿*4字节 = 4G*4 = 16
2017-04-25 12:29:58 1764
原创 itoa()函数实现
itoa()函数函数原型:char *itoa( int value, char *string,int radix);value:欲转换的数据。string:目标字符串的地址。radix:转换后的进制数,可以是10进制、16进制等,范围必须在 2-36。功能:将整数value 转换成字符串存入string 指向的内存空间 ,radix 为转换时所用基数(保存到字符串中的数
2017-04-05 15:30:55 494
原创 打印乘法表
从小学开始就在学习9*9乘法表,作为之处基础重重中的基础,在学会c语言后就像想实现以下一下这些基础的东西;void Multabl() //乘法表{ int i = 1; int j = 1; for (; i < 10; i++) { for (; j <= i; j++) { printf("%d * %d = %0.2d ",j,i,i*j); }
2017-04-05 13:44:30 278
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人