join之前重命名column,join还是bug,根本不行,能跑,但是左右是错的
spark 1.6 大坑之不要一个dataframe自己和自己join
最新推荐文章于 2021-08-12 11:05:31 发布
在Spark 1.6版本中,遇到一个重大问题,当尝试对同一个DataFrame进行自我JOIN操作时,即使在JOIN前重命名了列,仍然会出现JOIN错误。虽然代码能够执行,但JOIN结果是不正确的。这可能是由于版本的bug导致的数据混合,对开发和数据分析造成了困扰。
摘要由CSDN通过智能技术生成