海量数据处理
maqianmaqian
这个作者很懒,什么都没留下…
展开
-
hash
http://blog.redfox66.com/post/mass-data-topic-3-hash.aspx 【什么是Hash】 Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不...原创 2011-04-19 17:53:59 · 110 阅读 · 0 评论 -
bit_map
http://blog.redfox66.com/post/mass-data-4-bitmap.aspx 【 什么是Bit-map】 所谓的Bit-map就是用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。 如果说了这么多还没明白什么是Bit-map,那么我们来看一个具体的例子,假设我们要...原创 2011-04-19 17:55:40 · 85 阅读 · 0 评论 -
堆--
【什么是堆】 概念:堆是一种特殊的二叉树,具备以下两种性质 1)每个节点的值都大于(或者都小于,称为最小堆)其子节点的值 2)树是完全平衡的,并且最后一层的树叶都在最左边 这样就定义了一个最大堆。如下图用一个数组来表示堆: 那么下面介绍二叉堆:二叉堆是一种完全二叉树,其任意子树的左右节点(如果有的话)的键值一定比根节点大,上图其实就...原创 2011-04-19 17:57:24 · 63 阅读 · 0 评论 -
双层桶划分
http://blog.redfox66.com/post/mass-data-topic-6-multi-dividing.aspx 【什么是双层桶】 事实上,与其说双层桶划分是一种数据结构,不如说它是一种算法设计思想。面对一堆大量的数据我们无法处理的时候,我们可以将其分成一个个小的单元,然后根据一定的策略来处理这些小单元,从而达到目的。 【适用范围】 ...原创 2011-04-19 17:58:16 · 153 阅读 · 0 评论 -
最快排序和搜索算法的最简代码实现
http://blog.csdn.net/shendl/article/details/4053853原创 2012-03-08 18:22:24 · 74 阅读 · 0 评论 -
hbase相关
rowkey设计 http://san-yun.iteye.com/blog/1995829 http://www.open-open.com/lib/view/open1417612091323.html http://blog.csdn.net/ljp812184246/article/details/52526183 命令: http://www.cnblogs....原创 2017-03-28 18:44:40 · 187 阅读 · 0 评论 -
protobuffer
http://blog.csdn.net/antgan/article/details/52103966 http://www.tuicool.com/articles/YNJJni http://blog.csdn.net/qyf_5445/article/details/43793067原创 2017-03-09 10:54:46 · 107 阅读 · 0 评论