Big Data Technology
Go_Data__
Good Good Study!
Day Day No Hair!
展开
-
分布式文件系统之DFS复制、命名空间和NameNode
什么是分布式文件系统?百度百科:分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点(可简单的理解为一台计算机)相连。分布式文件系统的设计基于客户机/服务器模式。一个典型的网络可能包括多个供多用户访问的服务器。另外,对等特性允许一些系统扮演客户机和服务器的双重角色。意思就是,原本存在本地的...原创 2020-04-16 11:00:13 · 2538 阅读 · 0 评论 -
Cloud Computing 初见云计算
什么是云计算?百度百科解释为:“云计算(cloud computing)是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。”用通俗的话来说,云计算:云:代表了无所不在的,可以提供资源的网络,就像你头顶上的云一样可以无所不在,笼罩四方。计算:高效,方便,庞大的计算量,反正就是牛...原创 2020-04-15 21:47:22 · 428 阅读 · 0 评论 -
大数据技术入门之分布式处理、并行处理和MapReduce
什么是大数据?百度百科解释为:“是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。”有点高级有点绕。简化一下,大数据就是拥有很高价值不能轻易被推到(咳)处理的数据集合。就像你要去打一个数据究极体的boss,你需要带上最好的剑,翻过最高的山,闯进深的森林。boss挂了,自然...原创 2020-04-14 11:23:47 · 2201 阅读 · 0 评论