sparksql dataFrame 关于列的增删改操作

最新推荐文章于 2024-05-14 10:40:59 发布

xnlej

最新推荐文章于 2024-05-14 10:40:59 发布

阅读量1.5w

点赞数 1

文章标签： DataFrame列操作 sparksql sparksql udf

本文链接：https://blog.csdn.net/xnlej/article/details/80099620

版权

本文介绍在SparkSQL中如何进行DataFrame的列增删改操作，特别是在与ES和Redis集成的项目中。通过示例代码展示具体实现，包括从ES读取数据后对DataFrame进行列操作的场景。

摘要由CSDN通过智能技术生成

最近项目中用到spark和ES的集成，涉及到一系列对dataFrame列的操作，时间主要花在列的增删改上面。

整个类采用的是spark+ES+Redis架构，ES存基础数据，redis 存储条件，根据redis的条件从ES筛选出符合条件的记录。

val sqlContex = SparkSession.builder().master("local[2]")
  .appName("spark2ES")
  // .config("hive.metastore.uris", "thrift://172.1.1.199:9083") //集成hive
  .config("spark.testing.memory", "2147480000")
  .config("es.index.auto.create", "true")
  .config("es.nodes", "xxxx")
  // .enableHiveSupport() // 增加hive支持
  .getOrCreate()

// 读取es数据

val optionMap = Map("path" -> "ods_wj_apk_index/docs", "pushdown" -> "true")
val esDF = sqlContex.read.format("org.elasticsearch.spark.sql").options(optionMap).load()

// 增加列操作

// 方法一 sql的自定义函数
 val topic ="topic123"
tempDataFrame.createOrReplaceTempView("temp")
sqlContex.sqlContext.udf.register("replaceCol"

最低0.47元/天解锁文章

xnlej

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
sparksql dataFrame 关于列的增删改操作

最近项目中用到spark和ES的集成，涉及到一系列对dataFrame列的操作，时间主要花在列的增删改上面。整个类采用的是spark+ES+Redis架构，ES存基础数据，redis 存储条件，根据redis的条件从ES筛选出符合条件的记录。val sqlContex = SparkSession.builder().master("local[2]") .appName("spark2ES"...
复制链接

扫一扫