自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 2021-06-10

RDD编程初级实践 目录RDD编程初级实践一、实验目的二、实验平台三、实验内容和要求1.pyspark交互式编程2.编写独立应用程序实现数据去重3.编写独立应用程序实现求平均值问题四、实验过程(一)pyspark交互式编程(二)编写独立应用程序实现数据去重(三)编写独立应用程序实现求平均值问题 一、实验目的 1、熟悉Spark的RDD基本操作及键值对操作; 2、熟悉使用RDD编程解决实际具体问题的方法。 二、实验平台 操作系统:Ubuntu16.04 Spark版本:2.4.0 Python版本:3.4.3

2021-06-11 00:11:16 1081 2

原创 2020-12-19

在Linux OS中调用MapReduce对文件中单词出现次数进行统计 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录一、Ubuntu安装二、准备工作1.创建hadoop用户2.读入数据总结 一、Ubuntu安装 一般来说,如果要做服务器,我们选择CentOS或者Ubuntu Server;如果做桌面系统,我们选择Ubuntu Desktop。但是在学习Hadoop方面,虽然两个系统没有多大区别,但是我们强烈推荐新手读者使用Ubuntu操作系统。下面我们也会分别给出在Cent

2020-12-20 23:18:20 268 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除