大数据与云计算
文章平均质量分 81
亲吻昨日的阳光
这个作者很懒,什么都没留下…
展开
-
大数据相关术语(1)
1.大数据:英文:big data,mega data大数据指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。2.大数据的4V:英文:4V [volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)]3. HDFS(Hadoop Distributed FileSystem):原创 2015-04-07 17:55:13 · 1000 阅读 · 0 评论 -
盘点Hadoop生态圈:13个让大象飞起来的开源工具
Hadoop是由Apache基金会开发的一个大数据分布式系统基础架构,最早版本是2003年原Yahoo! Doug Cutting根据Google发布的学术论文研究而来。用户可以在不了解分布式底层细节的情况下,轻松地在Hadoop上开发和运行处理海量数据的应用程序。低成本、高可靠、高扩展、高有效、高容错等特性让Hadoop成为最流行的大数据分析系统,然而其赖以生存的HDFS和MapReduce组件转载 2015-04-29 09:02:26 · 712 阅读 · 0 评论 -
如何高效的阅读hadoop源代码?
这篇文章的内容是从知乎的帖子上摘抄下来的,是董西成的经验之作,虽然我还没有来的及通读源码,但觉得这经验有些意义就转载来与大家共享。============首先,不得不说,hadoop发展到现在这个阶段,代码已经变得非常庞大臃肿,如果你直接阅读最新版本的源代码,难度比较大,需要足够的耐心和时间,所以,如果你觉得认真一次,认真阅读一次hadoop源代码,一定要有足够的心理准备和时间预期。转载 2015-04-29 09:07:56 · 671 阅读 · 0 评论 -
大数据相关术语(2)
27.LDB(local DataBase):本地数据库本地数据库是指驻留于运行客户应用程序的机器上的数据库。本地数据库提供最快的相应时间。因为在客户端没有网络传输。本地数据库位于本地磁盘或局域网上。如果有几个用户同时访问数据库,本地数据库采取攘于文件的锁定策略。因此本地数据库叫基于文件的数据库。典型的有Paradox、dBasep、FoxPro、Access。28.DAQ原创 2015-04-28 09:30:52 · 793 阅读 · 0 评论