一、基本选择、删除操作(select, drop, withColumn, withColumnRenamed)
二、空值处理(na.drop,Imputer)
三、过滤操作(filter)
四、group_by/agg
五、分类特征转数值特征(StringIndexer)
六、将多个特征转为一个特征向量(VectorAssembler)
七、简单线性回归(LinearRegression)
训练测试
一、基本选择、删除操作(select, drop, withColumn, withColumnRenamed)
二、空值处理(na.drop,Imputer)
三、过滤操作(filter)
四、group_by/agg
五、分类特征转数值特征(StringIndexer)
六、将多个特征转为一个特征向量(VectorAssembler)
七、简单线性回归(LinearRegression)
训练测试