大数据
文章平均质量分 78
Zimuxs
这个作者很懒,什么都没留下…
展开
-
Hadoop配置和启动
Apache的Hadoop是一个开源的、可靠的、可扩展的系统架构,可利用分布式架构来存储海量数据,以及实 现分布式的计算。Hadoop允许使用简单的编程模型在计算机集群中对大型数据集进行分布式处理。可以从单个服务器扩展到数 千台机器,每个机器都提供本地计算和存储,而不是依靠硬件来提供高可用性。 此外,Hadoop集群的高可用性也非常良好,因为框架内的机制是可以够自动检测和处理故障。Hadoop的两个作用:①存储海量数据②计算海量数据Hadoop配置及启动的准备工作: 启原创 2022-04-25 09:52:20 · 6262 阅读 · 0 评论 -
大数据的概念
什么是大数据 大数据(big data,mega data),或称巨量资料。比如TB、PB级别的数据。 目前对于大数据特点的总结是5V特点:1)Volume(大量)为了更准确地理解人们现在面临的数据量大小,再来看一组公式:1024GB=1TB1024TB=1PB1024PB=1EB1024 EB=1ZB1024ZB=1YB在电子商务平台eBay上,每天新增的数据量达到50TB,1年累计的数据量即达到18PB。与之相对地,根据IDC的 研究报告,自人类开始记录历史以来,到200原创 2022-04-24 10:47:39 · 1913 阅读 · 0 评论