我的大数据之旅-Spark SQL DataFrame常用操作

本文深入探讨了Spark SQL中的DataFrame操作,包括数据加载、转换、过滤和聚合等核心功能,帮助读者理解如何在大数据处理中高效使用DataFrame。
摘要由CSDN通过智能技术生成
package com.fengling.sql

import org.apache.spark.SparkConf
import org.apache.spark.sql.{DataFrame, SparkSession}
import org.slf4j.LoggerFactory

case class People(name: String, age: Int)

/**
  * @author fengchengliang@126.com
  * @date 2019-10-17
  */
object SparkSQLDemo {
  val logger = LoggerFactory.getLogger(SparkSQLDemo.getClass)

  def main(args: Array[String]): Unit = {
    val config = Map(
      "spark.cores" -> "local[*]"
    )
    val sparkConf = new SparkConf().setMaster(config("spark.cores")).setAppName("Spark SQL basic example")
    // 创建SparkContext并设置AppName
    val spark = SparkSession.builder()
      .config(sparkConf)
      .getOrCreate()

    // For implicit conversions like converting RDDs to DataFrames
    import spark.implicits._

    val rdd = spark.sparkContext.parallelize(List(People("张三",12),People("李四",18),People("王五",2
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值