spark sql对hive中数据进行处理和存储

最新推荐文章于 2024-07-02 21:40:28 发布

宝罗

最新推荐文章于 2024-07-02 21:40:28 发布

阅读量1.3k

点赞数

分类专栏： scala 文章标签： spark sql hive

本文链接：https://blog.csdn.net/hhhhhhhhhhsdadaw/article/details/121909362

版权

首先创建一个scala工程叫做myhctest

因为运行会产生很多日志信息着你喔导入一个叫log4j的文件进行消除

然后创建以下几个类和特质

首先SaveTrait

trait SaveTrait {
  def dfSave(indf:DataFrame, ctx:SparkSession, tableName:String):Unit
}
//构建方法 indf是传入的dataframe也就是传入你hive中的表 
//因为spark sql是用的sparkSession中的所以后续要书写一个sparksession类
// tablenname也就是你要重新保存的表名称

hivesaveimpl

trait HiveSaveImpl extends SaveTrait {
  override def dfSave(indf: DataFrame, ctx:SparkSession, tableName: String): Unit = {
    indf.createOrReplaceTempView("hctest")//创建一个临时视图
    ctx.sql("insert overwrite table "+tableName+" select * from hctest")
  }

}

mysqlsaveimpl

trait MySqlSaveImpl extends SaveTrait {
  override def dfSave(indf: DataFrame, ctx:SparkSession, tableName:String)= {
    val prop = new Propertie

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

宝罗

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
spark sql对hive中数据进行处理和存储

首先创建一个scala工程叫做myhctest因为运行会产生很多日志信息着你喔导入一个叫log4j的文件进行消除然后创建以下几个类和特质首先SaveTraittrait SaveTrait { def dfSave(indf:DataFrame, ctx:SparkSession, tableName:String):Unit}//构建方法 indf是传入的dataframe也就是传入你hive中的表 //因为spark sql是用的sparkSession中的所以后续要.
复制链接

扫一扫