- 博客(3)
- 收藏
- 关注
原创 Hadoop生态圈技术概述
Hadoop 是一个开源的分布式计算框架,用于处理大规模数据集。它最初是由 Apache 软件基金会开发的,现在已经成为了处理大数据的标准工具之一。 大数据(Big Data)指的是数据量非常大、种类繁多、处理速度较快、数据价值密度较低、数据来源广泛的数据集合。处理大数据需要使用特定的技术和工具,例如分布式计算、数据挖掘、机器学习等等。 Hadoop 提供了一个分布式计算框架,可以在大规模的集群上存储和处理数据。它包含了分布式文件系统 HDFS 和分布式计算框架 MapReduce,可以让用户在不同的计
2023-04-09 21:07:28 607 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人