- 博客(2)
- 收藏
- 关注
原创 sparSQL1.1入门之六:sparkSQL之基础
SparkSQL引入了一种新的RDD——SchemaRDD,SchemaRDD由行对象(row)以及描述行对象中每列数据类型的schema组成;SchemaRDD很象传统数据库中的表。SchemaRDD可以通过RDD、Parquet文件、JSON文件、或者通过使用hiveql查询hive数据来建立。SchemaRDD除了可以和RDD一样操作外,还可以通过registerTempTable注册成临时
2014-11-20 23:58:04 697
原创 sparkSQL1.1入门之十:总结
前面两章花了不少篇幅介绍了SparkSQL的运行过程,很多读者还是觉得其中的概念很抽象,比如Unresolved LogicPlan、LogicPlan、PhysicalPlan是长得什么样子,没点印象,只知道名词,感觉很缥缈。本章就着重介绍一个工具hive/console,来加深读者对sparkSQL的运行计划的理解。 1:hive/console安装 spa
2014-11-07 13:02:49 300
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人