Spark学习之WordCount（Java版）

最新推荐文章于 2024-08-28 15:00:00 发布

pckzzy119

最新推荐文章于 2024-08-28 15:00:00 发布

阅读量498

点赞数 15

分类专栏：程序员文章标签： spark 学习 java

本文链接：https://blog.csdn.net/pckzzy119/article/details/138339706

版权

二、代码实现

package spark;

import org.apache.spark.SparkConf;

import org.apache.spark.api.java.JavaPairRDD;

import org.apache.spark.api.java.JavaRDD;

import org.apache.spark.api.java.JavaSparkContext;

import org.apache.spark.api.java.function.FlatMapFunction;

import org.apache.spark.api.java.function.Function;

import scala.Tuple2;

import java.util.Arrays;

import java.util.Iterator;

import java.util.List;

public class SparkWordCountForJava {

public static void main(String[] args) {

// 初始化spark , local[]：以核心数在本地运行

SparkConf conf = new SparkConf().setMaster(“local[*]”).setAppName(“SparkWordCountForJava”);

JavaSparkContext jsc = new JavaSparkContext(conf);

JavaRDD textFileRdd = jsc.textFile(“C:\Users\com\Desktop\test.txt”);

// 将数据按照切分规则分成一个个单词

JavaRDD flatMapRdd = textFileRdd.fl

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

pckzzy119

关注关注

15
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

4 | Java Spark实现 WordCount

微信号：RunsenLiu

09-01

1489

简单的 Java Spark 实现 WordCount 的教程，它将教您如何使用 Apache Spark 来统计文本文件中每个单词的出现次数。首先，确保您已经安装了 Apache Spark 并设置了运行环境。您需要准备一个包含文本内容的文本文件，以便对其进行 WordCount 分析。

spark wordcount java_spark - java 编程实现Word count

weixin_31310913的博客

02-12

332

本文通过一个demon向读者展示，如何用spark 实现word count 功能。创建项目创建maven项目，添加spark核心依赖org.apache.sparkspark-core_2.122.4.0如果使用java8版本还需要加入com.thoughtworks.paranamerparanamer2.8否则读取文件时候出现异常JavaRDD rdd1 = sc.textFile("/Us...

参与评论您还未登录，请先登录后发表或查看评论

Spark实现的hello world<转>

yongjian_luo的专栏

01-08

1736

spark,又一个传说中的分布式实现,详情:http://spark-project.org/, 安装这里就不写了，因为网上已有中文介绍，这里主要是介绍一下入门，和hadoop一样，学习的时候，首先学习spark提供的字符统计例子：javaWordCount 原始代码如下： Java代码 import scala.Tuple2; import spar

Java技术栈 —— Spark入门（二）之实时WordCount

最新发布

键盘国治理专家的博客

08-28

772

实验环境：假设你的用户为root，以下软件安装路径为/opt实验结构图。

spark系列 - wordCount( java版)

cj2580的博客

06-06

3369

环境说明 spark版本：1.6.1(已经安装完毕) os: centos6.5 java: 1.8 hadoop:2.3网上许多spark教程都是基于scala或者python的，通过这篇文章我们来使用spark的JavaAPI，来写一个wordCount程序，首先我们写个Java程序： pom.xml如下：<?xml version="1.0" encoding="UTF-8"?

用Spark写一个简单的wordcount词频统计程序

weixin_33805743的博客

06-08

940

public class WordCountLocal {public static void main(String[] args) {SparkConf conf = new SparkConf().setAppName("WordCountLocal").setMaster("local[2]");JavaSparkContext sc = new Jav...

Java版spark入门WordCount

qq_44962075的博客

04-19

657

最近新入职了一家公司，这家公司主要以开发大数据平台为主，主流语言用的是java语言，涉及到的组件有很多很多 kafaka、pg数据库、hbase、hudi、atlas、flink、spark、hive、hadoop、mongdb、presto、hbase、dolphinscheduler、alluxio等等，以前很少用java去写spark代码，如此一来感觉十分懵逼，以后准备更新以Java语言方向为主的大数据开发。这里先从基础开发，我这里先整理的是Java，JavaLambda，Scala三种方式的word

WordCount_Spark!_spark_wordcount_java_

10-01

总结，Spark上的WordCount程序是理解和学习Spark基础操作的好起点。通过这个简单的例子，我们可以深入理解Spark的工作原理，以及如何在Java环境中编写并执行Spark任务。在实际应用中，这些基本操作可以扩展到更复杂...

Spark 的JavaWordCount分步详解

晓晓的天空

03-16

1221

Spark 的JavaWordCount分步详解

Spark入门程序WordCount实现（Java）

机器学习，大数据

11-29

2547

文章目录1. 环境与数据准备1.1 运行环境1.2 数据准备2. 代码实现2.1 maven工程创建2.2 代码逻辑2.3 编译、打包、运行Reference 为了快速入门java与Spark工程的构建与开发，本次使用java实现Spark经典程序WordCount，过程记录如下，如有错误，请指正。 1. 环境与数据准备 1.1 运行环境 Hadoop：2.7.7 Spark：2.4.7 java：1.8.0_211 Maven：3.6.3 1.2 数据准备使用如下命令启动Hadoo

Spark：用Scala和Java实现WordCount

03-03

用Scala和Java实现WordCount，其中Java实现的JavaWordCount是spark自带的例子（$SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java）OS:RedHatEnterpriseLinuxServerrelease6.4...

java实现的spark的wordcount单词技术程序

12-06

采用java实现的spark的wordcount单词技术的程序.可以跑通。

Spark用Java实现的WordCount

大数据

12-04

1089

java版本的sparkWordCount /** * Java版本的spark WordCount */ public class JavaWordCount { public static void main(String[] args) { //1.先创建conf对象进行配置，主要是设置名称，为了设置运行模式 SparkConf conf = ne...

Spark入门-Java实现WordCount并打包测试

Horsleyli的博客

07-13

847

一、Java代码实现WordCount import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.api.java.function.FlatMapFunction; imp

Java实现第一个Spark应用-wordcount

aspkhdp的博客

03-15

773

1. 添加pom依赖 <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>2.2.0</version> &lt

Spark用Java编写WordCount

知其然，知其所以然

01-20

491

一.Spark用Java编写WordCount import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContex...

spark wordCount用java代码实现

weixin_43548518的博客

12-09

668

前言： java 代码编写spark 的wordCount 使用的方法和scala 基本相同除了生成（单词，1）时候使用的是mapToPair（）方法，代替了map() 因为在java中生成kv类型RDD 需要使用xxToPair 方法 public class SparkWc { public static void main(String[] args) { //...

Spark入门之Java实现WordCount

longwenyanlan的博客

12-04

493

import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.a...

基于Java的Spark WordCount编程实现

fengzhimohan的博客

11-13

1203

刚开始接触Spark编程，以WordCount作为入门编程实例，WordCount是用于统计单词出现的次数。本文参考http://blog.csdn.net/gongpulin/article/details/51534754，不同的是本文以Java语言实现实例的编程实现。a、案例分析对于词频数统计，用 Spark 提供的算子来实现，我们首先需要将文本文件中的每一行转化成一个个的单词, 其次是对