聚合需要分组,没有分组就会报错,无法出结果
没有分组代码如下:
报错内容:
报错内容其实也看不太懂,但是直接把报错内容粘贴复制到百度就可以搜到很多解决办法,有时候自己看不懂报错内容或者不知道怎么解决,这就是一种很好的解决办法。
分组后代码如下:(主要加了group by,顺便对结果根据sum_no字段排序,然后显示前三个)
结果如下:
问题就解决了。
还有一个问题就是spark SQL没办法选取中文字段,遇到这种情况可以把要选取的中文字段先修改成英文,然后再执行select就可以了。