在Spark编程进行指标清洗时出现cannot resolve ‘`consumptionavg`‘ given input columns报错

最新推荐文章于 2024-07-23 23:42:14 发布

墨要白不白

最新推荐文章于 2024-07-23 23:42:14 发布

阅读量478

点赞数

文章标签： spark 大数据分布式

本文链接：https://blog.csdn.net/m0_69035703/article/details/131401713

版权

在Spark编程进行指标清洗时出现cannot resolve ‘`consumptionavg`’ given input columns报错

问题背景：

进行数据分析计算练习中的指标计算过程中，通过已有的两条数据计算平均值consumptionavg，将计算出来的平均值consumptionavg保留两位小数

报错现象：

报错如图，通过阅读报错信息得知问题是无法解析给定的列：consumptionavg

ps：开始由于对报错信息阅读能力不足，将上一行信息Truncated the string representation of a plan since it was too large. 错认为报错信息，在程序的spark配置中添加config(“spark.debug.maxToStringFields”, “100”)后未能解决问题。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ug4Dk8lZ-1687770681651)(C:\Users\吴钩\AppData\Roaming\marktext\images\2023-06-25-02-20-00-image.png)]

后面认为是保留两位小数的语法不够正确，导致出现错误，通过百度查询了两条保留两位小数的语法，借鉴使用后依然报错。

df = df.selectExpr("round(money,2) as money" ,"created_ts","updated_ts");
df = df.selectExpr("cast(money as decimal(20,2)) as money" ,"created_ts","updated_ts");

原文链接：博客

实际的问题原因：

通过查看spark官方文档，得知出现无法解析给定列的可能原因有以下几种：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mzcaahEq-1687770681652)(C:\Users\吴钩\AppData\Roaming\marktext\images\2023-06-25-02-31-46-image.png)]

检查代码发现问题出在前一列的withcolumn函数中，定义consumptionavg列时多了一列括号，导致实际添加的列名是(consumptionavg)而不是consumptionavg，删除括号后问题解决。

反思：

这次的错误不属于技术性错误，而是语法性错误，主要责任在我对spark编程的语法不够熟练，对withcolumn函数和select函数的使用方式不够掌握
在阅读报错信息方面不够熟练，错把错误包信息认为了错误原因。
lect函数的使用方式不够掌握
在阅读报错信息方面不够熟练，错把错误包信息认为了错误原因。

墨要白不白

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
在Spark编程进行指标清洗时出现cannot resolve ‘`consumptionavg`‘ given input columns报错

ps：开始由于对报错信息阅读能力不足，将上一行信息Truncated the string representation of a plan since it was too large. 错认为报错信息，在程序的spark配置中添加config(“spark.debug.maxToStringFields”, “100”)后未能解决问题。这次的错误不属于技术性错误，而是语法性错误，主要责任在我对spark编程的语法不够熟练，对withcolumn函数和select函数的使用方式不够掌握。
复制链接

扫一扫