2025年03月_weixin_66009678

全部文章> 2025年03月

排序：: 按最后发布时间; 按访问量; RSS订阅

空空如也

云计算的文件，上次漏的

2025-01-07

Hadoop与Spark集群搭建及中文字频统计与Titanic数据分类实战

内容概要：本文档详细记录了在CentOS虚拟机上搭建Hadoop与Spark集群的全过程。首先介绍了安装CentOS虚拟机、配置网络的方法，接着详细说明了安装并配置Java环境、Hadoop集群的步骤。此外，还涉及了使用Hadoop进行英文和中文字频统计的具体操作。最后，讲述了如何安装Scala、Spark和Python，以及使用Spark对Titanic数据集进行分类的实现。适用人群：具备Linux基础知识和Hadoop/Spark初步了解的数据工程师或IT从业人员,大学课程设计。使用场景及目标：适用于需要在本地环境中搭建Hadoop与Spark集群进行大数据处理和分析的个人或团队，特别是对于理解和实操Hadoop和Spark的工作原理及其实际应用非常有帮助。其他说明：本文档提供了详细的命令行操作步骤和注意事项，确保读者能够顺利完成集群的搭建和各项实验。

2024-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_66009678的博客

空空如也

云计算的文件，上次漏的

Hadoop与Spark集群搭建及中文字频统计与Titanic数据分类实战

云计算，搭建分布式，然后实现Titantic数据集训练、分类的的代码

云计算，实现中文字频统计代码，课程设计

Behavior Cloning from Observation（BCO）数据

空空如也