自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (6)
  • 收藏
  • 关注

原创 Spark SQL源码函数解读及UDF/UDAF例子 spark研习第六集

四、 Spark SQL源码函数解读1. Spark SQL内置函数解密与实战SparkSQL的DataFrame引入了大量的内置函数,这些内置函数一般都有CG(CodeGeneration)功能,这样的函数在编译和执行时都会经过高度优化。问题:SparkSQL操作Hive和Hive on Spark一样吗?=> 不一样。SparkSQL操作Hive只是把H

2016-08-26 13:58:36 5360

原创 Spark SQL相关API操作实例 spark研习第五季

三、Spark SQL的操作实例1. Spark SQL数据加载和保存Spark SQL重要是操作DataFrame,DataFrame本身提供了save和load的操作, Load:可以创建DataFrame, Save:把DataFrame中的数据保存到文件或者说与具体的格式来指明我们要读取的文件的类型以及与具体的格式来指出我们要输出的文件是什么类型。

2016-08-26 13:54:33 3352

原创 Spark SQL与DataFrame原理解析与实现 spark研习第四季

二、 SparkSQL与DataFrame原理解析与实现1. SparkSQL与DataFrameSparkSQL之所以是除了SparkCore外最大的和最受关注的组件,原因是: A)处理一切存储介质和各种格式的数据(同时可以方便地扩展SparkSQL的功能来支持更多类型的数据,例如Kudo,Kudo在存储和计算效率间取得了完美的平衡),包括实时数据处理。201

2016-08-26 13:50:17 6164

原创 spark on hive原理与环境搭建 spark研习第三季

SparkSQL前身是Shark,Shark强烈依赖于Hive。Spark原来没有做SQL多维度数据查询工具,后来开发了Shark,Shark依赖于Hive的解释引擎,部分在Spark中运行,还有一部分在Hadoop中运行。所以讲SparkSQL必须讲Hive。一、spark on hive原理与搭建1. hive的本质1)Hive是分布式数据仓库,同时又是

2016-08-26 13:46:33 5642

新浪微博用户信息(50359条).rar

2012年12月新浪微博5万条用户信息数据,可以作为机器学习和深度学习训练资料

2019-10-29

小i机器人中文深度语义平台2017.5.25.pdf

小i机器人智能客服发布新版本,基于中文深度语义平台的chatbot,适用于各类深度知识的行业场景。

2019-10-29

MASTERING_HADOOP_3.pdf

Mastering Hadoop3最新版本pdf下载,包含最新的Hadoop版本案例实战

2019-10-29

xgboost实战讲义

xgboost实战课程,数据分析机器学习GDBT xgboost实战ppt

2018-08-14

C++ Primer中文版 第5版 [(美)李普曼,(美)拉乔伊,(美)默著][电子工业出版社][2013.08][838页]

C++ Primer中文版 第5版 [(美)李普曼,(美)拉乔伊,(美)默著][电子工业出版社][2013.08][838页]

2016-05-27

C++Primer第五版课本源代码

C++Primer第五版源代码

2016-04-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除