SparkStreaming实现HDFS的wordCount(java版)

最新推荐文章于 2024-08-11 07:00:00 发布

YQlakers

最新推荐文章于 2024-08-11 07:00:00 发布

阅读量2.3k

点赞数

分类专栏： Spark 文章标签： SparkStreaming

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YQlakers/article/details/72867799

版权

本文展示了如何利用SparkStreaming处理HDFS中的文件，具体实现了一个Java版的wordCount程序。首先创建一个包含特定单词的test-data.txt文件，然后在HDFS的sparkTest目录下运行该程序，观察并解析处理后的结果。

摘要由CSDN通过智能技术生成

利用sparkstreaming实现hdfs文件系统中的某个目录下的wordcount

代码如下：

package sparkTestJava;

import java.util.Arrays;

import org.apache.spark.SparkConf;
import org.apache.spark.api.java.function.FlatMapFunction;
import org.apache.spark.api.java.function.Function2;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.streaming.Durations;
import org.apache.spark.streaming.api.java.JavaDStream;
import org.apache.spark.streaming.api.java.JavaPairDStream;
import org.apache.spark.streaming.api.java.JavaStreamingContext;

import scala.Tuple2;

public class HDFSWordCount {

	public static void main(String[] args) {
		SparkConf conf = new SparkConf().setAppName("wordcount"

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

YQlakers CSDN认证博客专家 CSDN认证企业博客

码龄10年

37: 原创

18万+: 周排名

170万+: 总排名

22万+: 访问

: 等级

2413: 积分

33: 粉丝

54: 获赞

10: 评论

159: 收藏

私信

关注

热门文章

分类专栏

数据挖掘 2篇
python 1篇
python爬虫 1篇
java 20篇
Offer 5篇
TCP握手 2篇
Linux 4篇
JVM 1篇
Hadoop 9篇
java open
java opencsv 1篇
Mahout 2篇
Mysql 4篇
Hive 3篇
Zookeeper 3篇
Sqoop 1篇
Spark 11篇
kafka 2篇
机器学习 2篇
算法
数据结构 1篇
网络协议 2篇
HBase 2篇

最新评论

Hive与传统数据库的区别
亚楠18012043: 更新、事务和索引都是传统数据库最重要的特性，但是，直到最近，Hive也没有考虑支持这些特性 --对我有用，感谢作者的分享
Java的内存回收机制详解
时光无声_l: 感谢博主的分享，这是我看了这么多资料一来，最能理解的一篇
hadoop上的两种运行mapreduce程序的方法
YQlakers 回复氟化氢-xurb: 你先把平台搭起来再说分析的问题，这个工具并不难主要是你的分析部分算法但是我觉得你们老师让你分析的数据也不会太大用python或者java程序都能解决
hadoop上的两种运行mapreduce程序的方法
氟化氢-xurb 回复 YQlakers: 我现在有一大堆数据要分析，是我老师给我的，他建议我用Hadoop的MapReduce来统计分析，但我不是计算机专业的学生呀，所以我来csdnh找大牛，现在有点崩，嘿嘿嘿
hadoop上的两种运行mapreduce程序的方法
YQlakers: 你直接在这里描述你的问题哈可能不一定能解答你的疑惑我已经丢了一年了

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。