我正在使用Spark SQL读取Hive表并将其分配给
scala val
val x = sqlContext.sql("select * from some_table")
然后我正在使用数据帧x进行一些处理,最后得到一个数据帧y,它具有与表some_table一样的精确模式.
最后,我试图将y数据帧覆盖到同一个hive表some_table
y.write.mode(SaveMode.Overwrite).saveAsTable().insertInto("some_table")
然后我收到错误
org.apache.spark.sql.AnalysisException: Cannot insert overwrite into table that is also being read from
我尝试创建一个insert sql语句并使用sqlContext.sql()触发它,但它也给了我同样的错误.
有什么办法可以绕过这个错误吗?我需要将记录插回到同一个表中.
嗨,我尝试按照建议做,但仍然得到相同的错误.
val x = sqlContext.sql("select * from incremental.test2")
val y = x.limit(5)
y.registerTempTable("temp_table")
val dy = sqlContext.table("temp_table")
dy.write.mode("overwrite").insertInto("incremental.test2")
scala> dy.write.mode("overwrite").insertInto("incremental.test2")
org.apache.spark.sql.AnalysisException: Cannot insert overwrite into table that is also being read from.;