pyspark数据预处理
一、基本选择、删除操作(select, drop, withColumn, withColumnRenamed)
二、空值处理(na.drop,Imputer)
三、过滤操作(filter)
四、group_by/agg
五、分类特征转数值特征(StringIndexer)
六、将多个特征转为一个特征向量(VectorAssembler)
七、简单线性回归(LinearRegression)
训练测试
...
原创
2021-09-14 10:50:29 ·
539 阅读 ·
0 评论