大数据期末大作业

106邱子津 大数据期末大作业

把本地文件系统的“/home/hadoop/lgw.txt”上传到HDFS中的当前用户目录的input目录下,也就是上传到HDFS的“/user/hadoop/input/”目录下:

  1. ./bin/hdfs dfs -put /home/hadoop/lgw.txt input
    可以使用ls命令查看一下文件是否成功上传到HDFS中,具体如下:
  2. ./bin/hdfs dfs –ls input
    首先,启动Eclipse
    在这里插入图片描述

直接采用默认的设置“/home/hadoop/workspace”,工作空间目录位于hadoop用户目录“/home/hadoop”下。
Eclipse启动以后,呈现的界面如下图所示。
在这里插入图片描述

创建一个Java工程。
在这里插入图片描述

在“Project name”后面输入工程名称“WordCount”,选中“Use default location”,让这个Java工程的所有文件都保存在“/home/hadoop/workspace/WordCount”目录下。
进入下一步
在这里插入图片描述

需要在这个界面中加载该Java工程所需要用到的JAR包,这些JAR包中包含了与Hadoop相关的Java API。这些JAR包都位于Linux系统的Hadoop安装目录下,就是在“/usr/local/hadoop/share/hadoop”目录下。点击界面中的“Libraries”选项卡,然后,点击界面右侧的“Add External JARs…”按钮,弹出如下图所示界面。
在这里插入图片描述

为了编写一个MapReduce程序,一般需要向Java工程中添加以下JAR包:
(1)“/usr/local/hadoop/share/hadoop/common”目录下的hadoop-common-2.7.1.jar和haoop-nfs-2.7.1.jar;
(2)“/usr/local/hadoop/share/hadoop/common/lib”目录下的所有JAR包;
(3)“/usr/local/hadoop/share/hadoop/mapreduce”目录下的所有JAR包,但是,不包括lib、lib-examples和sources目录,具体如下图所示。
在这里插入图片描述

(4)“/usr/local/hadoop/share/hadoop/mapreduce/lib”目录下的所有JAR包。
比如,如果要把“/usr/local/hadoop/share/hadoop/common”目录下的hadoop-common-2.7.1.jar和haoop-nfs-2.7.1.jar添加到当前的Java工程中,可以在界面中点击相应的目录按钮,进入到common目录,然后,界面会显示出common目录下的所有内容(

  • 3
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hadoop是一种开源的分布式计算平台,可以用于大规模数据的存储和处理。它最初是由Apache软件基金会开发的,目的是为了应对大数据时代的挑战。 Hadoop的核心组件包括Hadoop分布式文件系统(HDFS)和Hadoop MapReduce。HDFS是一种高可靠性、高容错性的文件系统,它可以将大规模数据分布存储在集群中的多个节点上。通过将数据划分成不同的块并分布在不同的节点上,HDFS可以实现数据的并行读写,提高数据存储和访问的效率。 Hadoop MapReduce是一种编程模型,用于将大规模数据的处理任务分解成多个小任务并在分布式计算环境中并行执行。MapReduce的核心概念是将任务分为两个阶段:Map和Reduce。Map阶段将输入数据进行处理和转换,产生中间结果。Reduce阶段将中间结果进行整理和归约,生成最终结果。通过并行执行多个Map和Reduce任务,Hadoop可以高效地进行大规模数据处理。 除了HDFS和MapReduce,Hadoop还有其他一些重要的组件,如Hadoop YARN和Hadoop Common。Hadoop YARN是一个资源管理系统,负责协调集群中的计算资源,并为不同的应用程序提供资源调度和管理功能。Hadoop Common是Hadoop的公共库和工具集,提供了各种与Hadoop相关的功能和工具。 Hadoop具有许多优点,例如可扩展性强、容错性高、成本低廉、易于使用等。它可以帮助企业和研究机构处理大规模数据,并从中提取有价值的信息。随着大数据的不断增长和发展,Hadoop在各个行业中得到广泛应用,为数据分析和决策提供重要支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值