大数据
文章平均质量分 84
jim8757
在校大学生
展开
-
从问题域出发认识Hadoop生态系统
近些年来Hadoop生态系统发展迅猛,它本身包含的软件越来越多,同时带动了周边系统的繁荣发展。尤其是在分布式计算这一领域,系统繁多纷杂,时不时冒出一个系统,号称自己比MapReduce或者Hive高效几十倍,几百倍。有一些无知的人,总是跟着瞎起哄,说Impala将取代Hive,Spark将取代Hadoop MapReduce等。本文则从问题域触发,解释说明Hadoop中每个系统独特的作用/魅力以及转载 2014-11-26 20:10:53 · 417 阅读 · 0 评论 -
PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)
本文转自:http://www.cnblogs.com/baiboy/p/100p.html,作者整理了PayPal高级工程总监认为该读的大数据论文。摘要:本文基于PayPal高级工程总监Anil Madan写的大数据文章,其中涵盖100篇大数据的论文,涵盖大数据技术栈(数据存储层、键值存储、面向列的存储、流式、交互式、实时系统、工具、库等),全部读懂你将会是大数据转载 2016-08-03 15:42:22 · 1773 阅读 · 0 评论 -
树形结构的数据如何保存到关系型的数据库
需求:文档型数据,结构是树形的,如图:想要读取生成树形结构、添加子节点、查找修改数据的代价最小。看知乎上牛人的答案:一般比较普遍的就是四种方法:(具体见 SQL Anti-patterns这本书)Adjacency List:每一条记录存parent_idPath Enumerations:每一条记录存整个tree path经过的node枚举Nested转载 2016-08-31 15:41:33 · 20189 阅读 · 1 评论