java spark读写hdfs_Spark学习笔记——读写HDFS

最新推荐文章于 2024-06-30 21:15:04 发布

褚盟

最新推荐文章于 2024-06-30 21:15:04 发布

阅读量1k

点赞数

文章标签： java spark读写hdfs

本文链接：https://blog.csdn.net/weixin_28952093/article/details/114556914

版权

这篇博客介绍了如何使用Spark Scala读取HDFS中的Parquet文件，转换数据并写入MySQL，同时也展示了如何将数据写回新的Parquet文件。示例代码包括从Parquet文件创建DataFrame，转换数据结构，以及使用SparkSession读写数据。

摘要由CSDN通过智能技术生成

使用Spark读写HDFS中的parquet文件

文件夹中的parquet文件

build.sbt文件

name := "spark-hbase"

version := "1.0"

scalaVersion := "2.11.8"

libraryDependencies ++= Seq(

"org.apache.spark" %% "spark-core" % "2.1.0",

"mysql" % "mysql-connector-java" % "5.1.31",

"org.apache.spark" %% "spark-sql" % "2.1.0",

"org.apache.hbase" % "hbase-common" % "1.3.0",

"org.apache.hbase" % "hbase-client" % "1.3.0",

"org.apache.hbase" % "hbase-server" % "1.3.0",

"org.apache.hbase" % "hbase" % "1.2.1"

)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注