RDD->DF
简介:DataFrame是分布式数据和数据结构组成的组织集合,概念等同于关系型数据库里的表(dataframe.registerTempTable("tablename")注册内存表)。DataFrame的API支持Scala,java,Python,R。r4vrfSQLContext:SparkSQL的所有方法都在SQLContext类或它的子类里,用SparkContext创建一个SQLCon...
原创
2018-04-16 11:20:48 ·
373 阅读 ·
0 评论