spark
supersyd
这个作者很懒,什么都没留下…
展开
-
Spark 中 map 与 flatMap 的区别
vi test.txt this is 1st line we have 2nd line too val tf = sc.textFile("test.txt") //操作1 var mapResult=tf.map(line=>line.split("\\s+")) -- Array[Array[String]] = Array(Array(this,is,1st,line转载 2016-04-12 23:53:19 · 3139 阅读 · 0 评论 -
spark入门资料精化
Spark简介 spark 可以很容易和yarn结合,直接调用HDFS、Hbase上面的数据,和hadoop结合。配置很容易。 spark发展迅猛,框架比hadoop更加灵活实用。减少了延时处理,提高性能效率实用灵活性。也可以与hadoop切实相互结合。 spark核心部分分为RDD。Spark SQL、Spark Streaming、MLlib、GraphX、Spa转载 2016-04-12 23:26:27 · 773 阅读 · 0 评论 -
aggregateByKey
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type, U, than the typ转载 2016-04-21 00:13:35 · 1026 阅读 · 0 评论 -
spark api中的kvc
spark K: key V:value C:collection原创 2016-12-25 22:41:28 · 322 阅读 · 0 评论