spark分组排序三

huyang0101

于 2021-12-22 21:07:50 发布

阅读量1.2k

点赞数

分类专栏： spark二次排序文章标签： spark 大数据

本文链接：https://blog.csdn.net/huyang0101/article/details/122076853

版权

一、前言

没有阅读spark分组排序二的同学需要先阅读下才能理解本篇文章的优化逻辑。上demo源码

二、源码

import org.apache.spark.{
   Partitioner, SparkConf, SparkContext}


object Demo2 {
   
  def main(args: Array[String]): Unit = {
   
    val sc = new SparkContext(new SparkConf().setMaster("local[*]").setAppName("demo2"))

    val rdd1 = sc.textFile("ttxs-spark/data/teacher")

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

huyang0101

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark分组排序三

前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下（示例）：import numpy as npimport pandas as pdimport matplotlib.pyplot a
复制链接

扫一扫