- 博客(1)
- 资源 (2)
- 收藏
- 关注
原创 RDD的依赖关系
1,窄依赖是指每个父RDD的一个Partition最多被子RDD的一个Partition所使用,例如map、filter、union等都会产生窄依赖; 2,宽依赖是指一个父RDD的Partition会被多个子RDD的Partition所使用,例如groupByKey、reduceByKey、sortByKey等操作都会产生宽依赖 总结:如果父RDD的一个Partition被一个子RDD的
2017-03-31 15:07:33 388
Hive数据仓库(一)
Hive是hadoop领域的数据仓库。它提供了一套工具可以让我们非常方便的管理位于HDFS中的大型数据集,它提供了一套类似于SQL的查询语言,可以很容易的查询hive中的数据。Hive也有数据库、表、视图、索引、函数等概念,非常类似于我们常用的关系型数据库,因此入手非常方便。本资源是Hive授课讲义的一部分。
2016-09-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人