package com.njbdqn.mydataset
import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.functions._
/**
* 使用dataSet完成零售商店指标统计
* 1、使用RDD装在零售商店业务数据
* customers.csv、orders.csv、order_items.csv、products.csv
* 2、定义样例类
* 将RDD转成DataSet
*/
object MyThirdSpark1 {
//参照csv表格写样例类
case class Customers(userid:String,fname:String,lname:String,tel:String,email:String,addr:String,city:String,state:String,zip:String)
case class Orders(ordid:String,orddate:String,userid:String,ordstatus:String)
case class OrderItems(id:String,ordid:String,proid:String,buynum:String,countPrice:String,pr
Spark SQL API——使用Case Class创建Dataset
最新推荐文章于 2024-05-01 03:33:34 发布
本文深入探讨了如何使用Spark SQL API中的Case Class来创建Dataset,详细介绍了Case Class的概念及其在数据处理中的作用,通过实例展示了将数据转化为Case Class实例并操作Dataset的全过程,帮助读者掌握高效的数据操作技巧。

最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



