大数据
姓韩的大妹子
你好,我是姓韩的大妹子。
展开
-
大数据基础之Hadoop概述 -02
为什么要用Hadoop? 解决大量数据存储和分析过程中遇到的问题。Hadoop为我们提供了一个可靠的、可扩展的存储和分析平台,另外Hadoop运行在商用软件上,而且是开源的、免费的,因此使用Hadoop的成本比较低,是在用户的承受范围之内的。 Hadoop是什么? Hadoop是apache基金会旗下的一款顶级项目,用于解决大数据集的存储和计算分析,是用java语言开发的,所以具有跨平台性,也是开源的。它运行在廉价机器上,认为机器故障是常态,也是利用集群的cpu的并发和计算能力,性能非常高。 四..原创 2020-09-21 15:27:38 · 199 阅读 · 0 评论 -
大数据基础之大数据的概述 -01
一、大数据的概述 概念: 海量数据,具有高增长率、数据类型多样化,而且一定时间内无法使用常规软件工具 进行捕捉、管理和处理的数据集合。 特征: Volume(容量):巨大的数据量 Variety(多样化):数据类型多样化 Velocity(高速):数据增长速度快 Value:(价值):价值密度低 应用场景: (1)能做什么? 在大量的各种各样类型的价值密度低的数据中,需要进行数据采集、数据存储、数据清洗、数据分析、数据可视化。这个过程就是大数据的主要事情。那么可以概括为记录已经发生的一切、描原创 2020-09-21 14:50:03 · 157 阅读 · 0 评论