spark sql 2.x风格wordcount示例（二）

最新推荐文章于 2023-03-16 15:17:41 发布

辜智强 -buaa

最新推荐文章于 2023-03-16 15:17:41 发布

阅读量160

点赞数

文章标签： spark

本文链接：https://blog.csdn.net/m0_37719047/article/details/88687781

版权

import org.apache.spark.sql.types._
import org.apache.spark.sql.{DataFrame, Dataset, Row, SparkSession}

object WordCount1 {
  def main(args: Array[String]): Unit = {
    val  spark=SparkSession.builder().master("local[4]").appName("score").getOrCreate()
    val  read=spark.sparkContext.textFile("E://download//person.txt")
    val read1=read.map(x=>{
      val fields=x.split(",")
      Row(fields(0),fields(1).toInt,fields(2).toInt)
    })
    val schema: StructType = StructType(List(
      StructField("name", StringType, true),
      StructField("id", IntegerType, true),
      StructField("score", IntegerType, true)
    ))
    val df=spark.createDataFrame(read1,schema)
    df.show()
    import spark.implicits._
    df.selectExpr("id","score").where($"score">80).show()
    spark.close()

  }

}

数据

zhangsan,13,100
lisi,12,80
zhanghua,1,90
weige,3,79

结果
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

辜智强 -buaa

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

使用spark ,spark sql编写word count程序

HaLosec_Wei

08-28

760

Spark 版本 val conf=new SparkConf.setAppName("wc").setMaster("local[*]") val sc=SparkConText(conf, 2) val lines sc.textFile("hdfs://wc") val paris=lines.flatMap(_.spilt(" ")) val word =paris.map(_,1) ...

spark SQL、Dataframe、Dataframe 和 RDD 的区别、spark SQL WordCount

赤兔胭脂小吕布的博客

03-11

397

目录首先让我们来回顾一下 spark 的生态系统spark SQLDataframeDataframe 和 RDD 的区别spark SQL WordCount首先让我们来回顾一下 spark 的生态系统 spark SQL Dataframe 与RDD类似，DataFrame也是一个分布式数据容器。然而DataFrame更像传统数据库的二维表格，除了数据以外，还掌握数据的结构信息，即sch...

参与评论您还未登录，请先登录后发表或查看评论

spark sql 2.x风格wordcount示例（一）

云飞扬的博客

03-20

227

import org.apache.spark.sql.{DataFrame, Dataset, SparkSession} object SQLWordCount { def main(args: Array[String]): Unit = { //创建SparkSession val spark = SparkSession.builder() ....

SparkSQL入门案例之四(SparkSQL2.x)

while false

10-18

374

前几个案例讲的都是都是SparkSQL1.x的编程，所以这里就讲SparkSQL2.x的编程直接上代码，这里的代码是在前边案例的基础上的： package cn.ysjh0014.SparkSql import org.apache.spark.SparkConf import org.apache.spark.rdd.RDD import org.apache.spark.sql.ty...

Spark2.x学习笔记：17、Spark Streaming之HdfsWordCount 学习

程裕强的专栏

11-04

880

Spark2.x学习笔记：17、Spark Streaming之HdfsWordCount 学习17.1 HdfsWordCount 源码解析// scalastyle:off println package org.apache.spark.examples.streamingimport org.apache.spark.SparkConf import org.apache.spark.str

使用SparkSQL2.x的SQL方式实现WordCount

while false

10-18

667

代码里面有很详细的说明代码实现： package cn.ysjh0014.SparkSql import org.apache.spark.sql.{DataFrame, Dataset, SparkSession} object SparkSQLWordCount { def main(args: Array[String]): Unit = { //创建SparkS...

WordCount_Spark!_spark_wordcount_java_

10-01

在Spark上实现WordCount是入门的经典示例，它演示了如何处理大规模文本数据并进行简单的统计分析。在这个程序中，我们将深入理解Spark的核心概念，如RDD（弹性分布式数据集）以及并行计算的基本操作。 **1. Spark...

Spark 的JavaWordCount分步详解

最新发布

晓晓的天空

03-16

1203

Spark 的JavaWordCount分步详解

spark2官方示例源代码

08-27

Spark2官方示例源代码提供了丰富的实例，帮助开发者更好地理解和使用Spark进行数据处理任务。这些示例涵盖了多种常见的数据处理场景，如文本分析、数据库交互、Parquet文件操作以及JSON数据处理等。一、WordCount ...

Spark Streaming、离线计算、实时计算、实时查询、Spark Streaming 原理、Spark Streaming WordCount、Spark Streaming 架构图...

赤兔胭脂小吕布的博客

03-13

249

目录Spark Streaming离线计算、实时计算、实时查询Spark Streaming 原理Spark Streaming WordCount1、导入依赖2、WordCount 示例Spark Streaming 架构图Spark Streaming spark 中最重要的就是 spark core 和 spark sql (也就是之前笔记的内容) 离线计算、实时计算、实时查询 S...

sparksql 2.x 写WordCount

念念的博客,记录学习的点点滴滴！

10-05

881

package com.ws.sparksql import org.apache.spark.sql.{DataFrame, Dataset, SparkSession} object SqlWordCount { def main(args: Array[String]): Unit = { val spark = SparkSession.builder().appName(...

Spark,SparkSql wordCount,java wordcount

jiangzeyun的专栏

10-03

760

Spark SQL 版本 package com.jiangzeyun.sparkSQl; import java.util.Arrays; import java.util.Random; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.sql.Dataset; import org.apache.sp...

Spark on Yarn上实现WordCount程序

Programmer_Story的专栏

01-06

1093

在Spark on Yarn上运行WordCount程序

Spark-2.0.1 安装及 WordCount (详细图文)

M_SIGNALs的博客

11-24

4104

centos 6.5 安装 spark-2.0.1-bin-hadoop-2.6.tgz

子雨大数据之Spark入门教程---Spark2.1.0入门：第一个Spark应用程序：WordCount 2.2

飘过的春风

02-23

7445

原博客地址： http://dblab.xmu.edu.cn/blog/1311-2/ 前面已经学习了Spark安装，完成了实验环境的搭建，并且学习了Spark运行架构和RDD设计原理，同时，我们还学习了Scala编程的基本语法，有了这些基础知识作为铺垫，现在我们可以没有障碍地开始编写一个简单的Spark应用程序了——词频统计。任务要求任务：编写一个Spark应用程序，对某个文件中...

spark-sql 1.x版本与2.x版本的wordcount实现

自由幻想的博客

01-29

533

spark-sql的操作对象由dataframe变为了datasetspark-sql是spark的一个组件，可以在spark程序中进行SQL查询。是一个分布式的sql查询引擎。spark-sql在1.3的版本中开始使用dataframe对象，来对数据进行操作。dataframe=rdd+schema语法风格分为两种：SQL语法风格：dataframe对象注册虚拟表后查询，DSL语法风格dataf...

Spark SQL简单示例(WordCount)

程序员学习圈

01-09

1058

1.SparkSQL查询-SparkShell中使用 1.employees.json原始数据如下： {"name":"Michael", "salary":3000} {"name":"Andy", "salary":4500} {"name":"Justin", "salary":3500} {"name&quo

Spark组件之Spark Streaming学习3--结合SparkSQL的使用(wordCount)

Keep Learning

04-26

2909

1.通过建立一个对象来获取Streaming的单例对象 val sqlContext = SQLContextSingleton.getInstance(rdd.sparkContext) import sqlContext.implicits._ object SQLContextSingleton { @transient private var instance

Spark 编写WordCount程序

ITBOY_ITBOX博客

05-08

356

注：此案例是以yarn的模式进行运行的，所以你需要启动hdfs与yarn集群 1.创建一个Maven项目WordCount并导入依赖 <dependencies> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spar...

Spark RDD基础教程：并行计算与WordCount示例

Spark Ecosystem 包括了 Spark SQL、Spark Streaming、GraphX 和 MLLib，这些工具扩展了 Spark 的功能，使其能够处理结构化数据、实时流处理和图形处理等任务。机器学习是 Spark 的重要应用领域，通过 MLlib 库提供...

spark sql 2.x风格wordcount示例 （二）

spark sql 2.x风格wordcount示例（二）