- 博客(2)
- 收藏
- 关注
原创 RDD编程初级实践
RDD编程初级实践1、需求描述2、环境介绍系统介绍本实验的编程环境3、数据来源描述1) Pyspark交互式编程2) 编写独立应用程序实现数据去重3) 编写独立应用程序实现求平均值问题4、数据上传及上传结果5、数据处理过程描述pyspark交互式编程编写独立应用程序实现数据去重编写独立应用程序实现求平均值问题6、经验总结1、需求描述在当今信息化时代中,随着大数据的快速发展情况下,大数据应用于社会的各方面的发展及进步。通过实验使我们熟悉Spark的RDD基本操作和键值对操作;以及熟悉使用RDD编程解决实际
2021-06-10 20:51:56 659 2
原创 调用MapReduce对文件中各个单词出现次数进行统计
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、Linux的安装二、准备工作1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、Linux的安装1.打开VirtualBox,点击“创建”按钮,创建一个虚拟机2.分配内存3.创建虚拟硬盘(1)创建虚拟硬盘(2)选
2020-12-20 16:44:30 430 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人