关于在使用sparksql写程序是报错以及解决方案:org.apache.spark.sql.AnalysisException: Duplicate column(s): "name" found,...

在使用SparkSQL 2.2.0处理两个JSON文件进行join操作时,由于存在相同的列名"name",导致在save阶段出现`org.apache.spark.sql.AnalysisException: Duplicate column(s): "name"`错误。解决方案是为冲突的列名赋予不同的别名,避免在join后保存时发生冲突。具体步骤包括:1) 初始化配置;2) 加载JSON文件;3) 打印加载的DataFrame验证成功;4) 别名处理冲突列;5) 使用别名后的DataFrame进行join并保存,成功将结果写入本地Windows路径,且注意HDFS路径的正确写法。
摘要由CSDN通过智能技术生成

说明:

  spark --version : 2.2.0

  我有两个json文件,分别是emp和dept:

emp内容如下:

{"name": "zhangsan", "age": 26, "depId": 1, "gender": "male", "salary": 20000}
{
    "name": "lisi", "age": 36, "depId": 2, "gender": "female", "salary": 8500}
{
    "name": "wangwu", "age": 23, "depId": 1, "gender": "male", "salary": 5000}
{
    "name": "zhaoliu", "age": 25, "depId": 3, "gender": "male", "salary": 7000}
{
    "name": "marry", "age": 19, "depId": 2, &#
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值