import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.VoidFunction;
import java.util.Arrays;
import java.util.List;
/**
* spark常用Action算子:forEach(VoidFunction)
* 对数据集中每一个元素运行无返回值的函数 VoidFunction。
*
*/
public class ForEachDemo {
public static void main(String[] args) {
SparkConf conf = new SparkConf().setMaster("local").setAppName("spark");
JavaSparkContext sc = new JavaSparkContext(conf);
List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 6);
JavaRDD<Integer> listRdd = sc.parallelize(list);
//通用格式
listRdd.foreach(new VoidFunction<Integer>() {
@Override
public void call(Integer integer) throws Exception {
System.out.println( integer );
}
});
//java8 lambda表达式的形式
listRdd.foreach( i -> System.out.println( i*i ) );
}
}
Java Spark算子:forEach
最新推荐文章于 2022-07-22 11:52:31 发布