- 博客(2)
- 资源 (9)
- 收藏
- 关注
原创 SparkSQL快速入门系列(6)
上一篇《SparkCore快速入门系列(5)》,下面给大家更新一篇SparkSQL入门级的讲解。 第一章 Spark SQL概述 1.1 Spark SQL官方介绍 ●官网 http://spark.apache.org/sql/ Spark SQL是Spark用来处理结构化数据的一个模块。 Spark SQL还提供了多种使用方式,包括DataFrames API和Datasets API。但无论是哪种API或者是编程语言,它们都是基于同样的执行引擎,因此你可以在不同的API之间随意切换,它们各有各的特.
2020-07-31 13:57:03 1435
原创 SparkCore快速入门系列(5)
铁铁们,博主前段时间在做一些项目加上找工作所以到现在才更新,(__) 嘻嘻…… 博主现在已经工作啦,后期会给你们更新一些关于数据库以及报表开发的文章哦! 接下来言归正传!!!!!! 1、RDD详解 1.1. 什么是RDD 1.1.1 为什么要有RDD? 在许多迭代式算法(比如机器学习、图算法等)和交互式数据挖掘中,不同计算阶段之间会重用中间结果,即一个阶段的输出结果会作为下一个阶段的输入。但是,之前的MapReduce框架采用非循环式的数据流模型,把中间结果写入到HDFS中,带来了大量的数据复制、磁盘.
2020-07-30 13:53:58 3474 1
Arm架构下的hadoop-aarch64-3.3.1版本安装包
2022-10-21
nexmark源码包-可用于flink和spark测试基准
2022-10-21
cloudera-manager-server-db-2-6.3.1-1466458.el7.x86_64.rpm
2021-04-06
cloudera-manager-server-6.3.1-1466458.el7.x86_64.rpm
2021-04-06
cloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpm
2021-04-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人