SparkSQL的数据结构和代码初体验

1.SparkSQL的数据结构

  • 1.3版本 DataFrame
  • 1.6版本 DataSet
  • 2.0版本 DataFrame = DataSet[ROW]
  • 注意: ROW: DataFrame中每条数据封装在Row中,Row表示每行数据

2. SparkSQL的代码初体验

import org.apache.spark.SparkContext
import org.apache.spark.sql.{Dataset, SparkSession}

/**
 * @author liu a fu
 * @date 2021/1/14 0014 22:42
 * @version 1.0
 */
/**
 *   这里就是通过SparkSession入口实现SparkSQL的简单的操作
 */
object _01FirstSparkSql {

  def main(args: Array[String]): Unit = {

    val sparkSql: SparkSession = SparkSession     //SparkSQL的入口
      .builder()
      .appName(this.getClass.getSimpleName.stripSuffix("$"))
      .master("local[*]")
      .getOrCreate()

    //导入SparkContext
    val sc: SparkContext = sparkSql.sparkContext
    sc.setLogLevel("WARN")

    //读取数据文件
    val valueDS: Dataset[String] = sparkSql.read.textFile("data/input/words.txt")
    //简单统计几行数据
    println("record counts is:",valueDS.count())     //(record counts is:,3)
    //使用show查看
    valueDS.show()

    /**
     * 结果: 直接映射成了一张表
     */
    //   +--------------------+
    //   |               value|
    //   +--------------------+
    //   | hello hurong liuafu|
    //   |hello kobe  hello...|
    //   | hello         james|
    //    +--------------------+

    //关闭spark
    sparkSql.stop()
  }

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值