一般的join都可以使用,但是如果没有唯一键,还想进行连接,就使用innerjoin,并且在join之后使用distinct,而且切记表的位置,如果不好使,还有重复,就换一下左右位置,亲测好使;
还有当join之后字段重复,可以指定join之前的df名的中的字段dfname("colname")的方式;
spark在预测值中切记features中不要加入标签,让不然acc一直是1.0;
一般的join都可以使用,但是如果没有唯一键,还想进行连接,就使用innerjoin,并且在join之后使用distinct,而且切记表的位置,如果不好使,还有重复,就换一下左右位置,亲测好使;
还有当join之后字段重复,可以指定join之前的df名的中的字段dfname("colname")的方式;
spark在预测值中切记features中不要加入标签,让不然acc一直是1.0;