自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

空空如也

云计算的文件,上次漏的

云计算的文件,上次漏的

2025-01-07

Hadoop与Spark集群搭建及中文字频统计与Titanic数据分类实战

内容概要:本文档详细记录了在CentOS虚拟机上搭建Hadoop与Spark集群的全过程。首先介绍了安装CentOS虚拟机、配置网络的方法,接着详细说明了安装并配置Java环境、Hadoop集群的步骤。此外,还涉及了使用Hadoop进行英文和中文字频统计的具体操作。最后,讲述了如何安装Scala、Spark和Python,以及使用Spark对Titanic数据集进行分类的实现。 适用人群:具备Linux基础知识和Hadoop/Spark初步了解的数据工程师或IT从业人员,大学课程设计。 使用场景及目标:适用于需要在本地环境中搭建Hadoop与Spark集群进行大数据处理和分析的个人或团队,特别是对于理解和实操Hadoop和Spark的工作原理及其实际应用非常有帮助。 其他说明:本文档提供了详细的命令行操作步骤和注意事项,确保读者能够顺利完成集群的搭建和各项实验。

2024-12-22

云计算,搭建分布式,然后实现Titantic数据集训练、分类的的代码

云计算,搭建分布式,然后实现Titantic数据集训练、分类的的代码

2024-12-22

云计算,实现中文字频统计代码,课程设计

云计算,实现中文字频统计代码,课程设计

2024-12-22

Behavior Cloning from Observation(BCO)数据

行为克隆的数据

2024-11-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除