在HDInsight上运行Scala实现的Hadoop作业

以前,我们设置了Scala应用程序 ,以便在hadoop上执行简单的字数统计。

接下来是将我们的应用程序上载到HDInsight。

因此,我们将继续在HDInsight上创建Hadoop集群。

然后,我们将创建hadoop集群。

如您所见,我们指定了管理控制台凭据和ssh用户来登录头节点。

我们的hadoop集群将由一个Azure存储帐户提供支持。

然后是时候将我们的文本文件上传到Azure存储帐户了。

有关使用azure cli管理存储帐户的更多信息,请查看官方指南 。 任何文本文件都可以。

azure storage blob upload mytext.txt scalahadoopexample  example/data/input.txt

现在我们可以使用ssh到我们的Hadoop节点。

首先,我们运行HInsight hadoop集群随附的示例。

hadoop jar /usr/hdp/current/hadoop-mapreduce-client/hadoop-mapreduce-examples.jar wordcount /example/data/input.txt /example/data/results

检查结果

hdfs dfs -text /example/data/results/part-r-00000

然后我们准备将scala代码scp到我们的hadoop节点并以wordcount的形式发布。

hadoop jar ScalaHadoop-assembly-1.0.jar /example/data/input.txt /example/data/results2

并再次检查结果

hdfs dfs -text /example/data/results2/part-r-00000

而已! HDinsight使它变得非常简单!

翻译自: https://www.javacodegeeks.com/2017/02/run-scala-implemented-hadoop-jobs-hdinsight.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值