- 博客(4)
- 收藏
- 关注
原创 大数据架构笔记
Hadoop 是基于 Java 语言开发的,具有很好的跨平台特性。Hadoop 的核心是分布式文件系统HDFS和 MapReduce。HDFS支持大规模数据的分布式存储,其冗余数据存储的方式很好地保证了数据的安全性;采用 MapReduce 来整合分布式文件系统上的数据,可保证分析和处理数据的高效性。Hadoop 生态系统还包括 ZooKeeper、HBase、Hive、Pig、Mahout、Flume、Sqoop、Ambari 等功能组件。
2024-12-05 16:45:28
1972
原创 虚拟机Ubuntu上Spark安装和编程实践
1.安装 Spark3.5.31.1 下载并安装Hadoop(伪分布式)(1)首先下载Spark-3.5.3wget(2)安装基础安装Hadoop3.3.4(伪分布式),如果没有安装,请先安装并配置hadoop伪分布式模式。
2024-11-26 10:26:45
3387
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅