Spark
文章平均质量分 82
@听风吟
请成为厉害的大人和更可爱的小孩
展开
-
spark:Structured Streaming介绍
spark:Structured Streaming介绍原创 2024-10-16 20:33:28 · 1047 阅读 · 0 评论 -
Spark SQL 的离线数仓开发
Spark SQL的离线数仓开发原创 2024-10-15 15:52:16 · 239 阅读 · 0 评论 -
Spark数据源的读取与写入、自定义函数
Spark数据源的读取与写入、自定义函数原创 2024-10-15 15:14:28 · 520 阅读 · 0 评论 -
Spark内置函数:字符串、日期和时间函数、聚合函数、数值函数、条件判断函数、窗口函数
Spark内置函数:字符串、日期和时间函数、聚合函数、数值函数、条件判断函数、窗口函数原创 2024-10-15 11:38:13 · 972 阅读 · 0 评论 -
spark:数据的关联与合并、缓存和checkpoint
spark:数据的关联与合并、缓存和checkpoint原创 2024-10-14 20:22:05 · 423 阅读 · 0 评论 -
Spark:DataFrame介绍及使用
DataFrame介绍及使用原创 2024-10-13 21:07:53 · 772 阅读 · 0 评论 -
SparkSQL介绍及使用
SparkSQL介绍及使用原创 2024-10-13 20:28:02 · 534 阅读 · 0 评论 -
RDD优化:缓存和checkpoint机制、数据共享(广播变量、累加器)、RDD的依赖关系、shuffle过程、并行度说明
RDD优化:缓存和checkpoint机制、数据共享(广播变量、累加器)、RDD的依赖关系、shuffle过程、并行度说明原创 2024-10-11 21:15:53 · 1471 阅读 · 0 评论 -
Spark常用RDD算子:transformation转换算子以及action触发算子
transformation 转换算子对RDD数据进行转化得到新的RDD,定义了一个线程任务。常见:map、filter、flatMap、reduceByKey、groupByKey、sortByKeyaction 执行算子触发计算任务,让计算任务进行执行,得到结果。触发线程执行的。常见:foreach、first、count、reduce、saveAsTextFile、collect、take。原创 2024-10-10 19:45:00 · 1565 阅读 · 1 评论 -
Hadoop服务端口号、Spark端口号、Hive端口号以及启动命令
Hadoop服务端口号、Spark端口号、Hive端口号以及启动命令原创 2024-10-09 15:12:25 · 703 阅读 · 0 评论 -
RDD的介绍、RDD的特点、创建RDD数据
RDD的介绍、RDD的特点、创建RDD数据原创 2024-10-09 11:09:54 · 1248 阅读 · 0 评论 -
一篇文章带你了解数据处理方式(单机数据处理、集群数据处理)、分布式计算框架、Spark的分布式计算、多任务以及进程和线程的区别
数据处理方式(单机数据处理、集群数据处理)、分布式计算框架、Spark的分布式计算、多任务以及进程和线程的区别原创 2024-10-09 08:47:17 · 920 阅读 · 0 评论