spark创建DF的两种方式

最新推荐文章于 2022-11-18 23:02:50 发布

VIP文章 xiaoyaGrace

最新推荐文章于 2022-11-18 23:02:50 发布

阅读量1.1k

点赞数

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoyaGrace/article/details/102897196

版权

方式一：反射：(使用这种方式来创建DF是在你知道字段具体有哪些)
1.创建一个SparkContext，然后再创建SQLContext
2.先创建RDD，对数据进行整理，然后关联case class，将非结构化的数据转换成结构化数据
3.显示的调用toDF方法，将RDD转换成DF（需要隐私转换）
4.注册临时表
5.执行SQL(Transformation,lazy)
6.zhixAction

val conf = new SparkConf().setAppName("df").setMaster("local")
val sc = new SparkContext(conf)
val sqlContext = new SQLContext(sc)
//创建一个普通RDD
val rdd = sc.textFile("G:\\qf大数据\\spark\\day06_sql\\students.txt")
val student: RDD[Student] = rdd.map(x => {
val sp = x.split(" ")
Student(sp(0).toInt, sp(1), sp(2).toInt)
})
import sqlContext.implicits._
val df: Dat

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark创建DF的两种方式

方式一：反射：(使用这种方式来创建DF是在你知道字段具体有哪些) 1.创建一个SparkContext，然后再创建SQLContext 2.先创建RDD，对数据进行整理，然后关联case class，将非结构化的数据转换成结构化数据 3.显示的调用toDF方法，将RDD转换成DF（需要隐私转换） 4.注册临时表 5.执行SQL(T...
复制链接

扫一扫

专栏目录

xiaoyaGrace CSDN认证博客专家 CSDN认证企业博客

码龄5年

1265: 原创

13万+: 周排名

193万+: 总排名

53万+: 访问

: 等级

1万+: 积分

62: 粉丝

107: 获赞

42: 评论

678: 收藏

私信

关注

热门文章

分类专栏

最新评论

华为OD两轮技术面试
梦想橡皮擦: 华为OD机试题 Python，java，C++，js 代码分享，帮助600+人高分通过机试了 https://blog.csdn.net/hihell/category_12199275.html
用python算卦——银钱演算法
muenfox: 感谢分享，学习了
HBase 中加盐（Salting）之后的表如何读取：协...
qq_36469875: 話説你們實現過嗎? proto 生成的java類，裏面有很多語法錯誤，以及包找不到
标准正交表与混合正交表的使用
搞测试的: 在哪下载呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。