spark模拟密集型计算任务

最新推荐文章于 2022-09-17 13:09:51 发布

young_so_nice

最新推荐文章于 2022-09-17 13:09:51 发布

阅读量1.3k

点赞数

分类专栏： spark 文章标签： spark 函数 filter 测试

本文链接：https://blog.csdn.net/young_so_nice/article/details/51584570

版权

spark 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

一，场景：我们随机的产生两点，测试有多少个会落在单位圆内，多少落在外面。
二，函数解释：
1，parallelize()函数是指内部导入数据。
2，filter()函数功能是对元素进行过滤，对每个元素应用f函数，返回值为true的元素在RDD中保留，返回值为false的元素将被过滤掉。
3，count()函数，返回整个RDD的元素个数。

代码展示：

import java.util.ArrayList;
import java.util.List;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;
public class ComputIntensiveTasks2 {
    public static void main(String[] args) {
        SparkConf conf=new SparkConf();
        conf.set("spark.testing.memory", "2147480000");
        System.out.println("连接建立好了，准开始了"+conf);
        JavaSparkContext sc=new JavaSparkContext("local","ComputIntensinve",conf);
        int NUM_SAMPLES=5;
        List<Integer> l=new ArrayList<Integer>(NUM_SAMPLES);
        for(int i=0; i<NUM_SAMPLES;i++){
            l.add(i);
        }
        long count=sc.parallelize(l).filter(new Function<Integer,Boolean>(){
            public Boolean call(Integer arg0) throws Exception {
                double x=Math.random();
                double y=Math.random();
                return x*x+y*y<1;
            }}).count();
        System.out.println("Pi is roughly "+4.0*count/NUM_SAMPLES);
    }

}

young_so_nice

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark模拟密集型计算任务

一，场景：我们随机的产生两点，测试有多少个会落在单位圆内，多少落在外面。二，函数解释： 1，parallelize()函数是指内部导入数据。 2，filter()函数功能是对元素进行过滤，对每个元素应用f函数，返回值为true的元素在RDD中保留，返回值为false的元素将被过滤掉。 3，count()函数，返回整个RDD的元素个数。代码展示：import j
复制链接

扫一扫

专栏目录