分布计算
文章平均质量分 58
sniper24
略懂Python,略懂Data Mining,大数据分析新兵
展开
-
Hive table 操作
http://www.cnblogs.com/ggjucheng/archive/2013/01/04/2844393.htmlCreate [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], …)] [COMMENT table_comment] [PARTITI原创 2015-11-02 14:58:14 · 142 阅读 · 0 评论 -
pyspark笔记
pyspark.sql.SQLContextTop funcs: 1. 创建DF createDataFrame(data,schema) 2. 从多种数据源读取数据,sqlContext 3. user-define类 registerDataFrameAsTable(df, tableName) registerFunction(name, f, returnType=StringT原创 2015-10-26 11:36:06 · 1149 阅读 · 0 评论