Spark读取csv文件

最新推荐文章于 2024-04-29 11:12:25 发布

庐州小白

最新推荐文章于 2024-04-29 11:12:25 发布

阅读量1.5k

点赞数

分类专栏：大数据文章标签： spark

本文链接：https://blog.csdn.net/weixin_42194781/article/details/106528193

版权

大数据专栏收录该内容

16 篇文章 0 订阅

订阅专栏

通过SparkSession读取csv文件时，可以通过option方法来自动识别csv文件的标题，推断数据类型

def main(args: Array[String]): Unit = {

    Logger.getLogger("org").setLevel(Level.WARN)

    val spark = SparkSession.builder().appName("Spark Sql 2.x 5")
      .master("local")
      .getOrCreate()

    //读取csv后直接就是df，但是，此时没有表头，需要手动添加
    val df: DataFrame = spark.read
      //自动识别表头
        .option("header",true)
      //自动推断类型
      .option("inferSchema", true)
      .csv("D:\\coding\\java\\BigData\\File\\boys.csv")

    df.printSchema()

    spark.stop()
}

若是没有表头，可以通过toDF方法指定。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

庐州小白

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Spark读取csv文件

通过SparkSession读取csv文件时，可以通过option方法来自动识别csv文件的标题，推断数据类型def main(args: Array[String]): Unit = { Logger.getLogger("org").setLevel(Level.WARN) val spark = SparkSession.builder().appName("Spark Sql 2.x 5") .master("local") .getOrCreate
复制链接

扫一扫