![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Scala
一只土肥圆的猿
我是谁?我在哪?
-- 起来写代码!!!
展开
-
spark2.0版本RDD、DataFrame、DataSet介绍
1. 相关概念1) RDD:spark中最基本的 弹性分布式数据集,提供了很多api 来操作数据集中的元素2) DataFrame:spark的基于RDD的一种高级抽象,在RDD之上加入了scheme信息,给RDD的元素的每一列提供了 名称和数据类型 的标志;同 时它还提供了更多的api,可以实现类似于sql的操作;但是DataFrame也丢掉了RDD的优点:编译时类型检查和面向对原创 2017-11-24 17:26:17 · 498 阅读 · 0 评论 -
spark--集合操作示例
一、常用操作符(操作符其实也是函数)++ ++[B](that: GenTraversableOnce[B]): List[B] 从列表的尾部添加另外一个列表++: ++:[B >: A, That](that: collection.Traversable[B])(implicit bf: CanBuildFrom[List[A], B, That]): That 在列表的头部添加...翻译 2017-11-27 17:44:20 · 2725 阅读 · 0 评论