在Win10下配置hardoop和hbase

本文介绍在windows下配置hardoop和hbase:

目录

准备版本

配置环境

配置hadoop

配置hbase

参考资料

准备版本

  1. Java:jdk1.8.0_231。
  2. Hadoop:3.2.3。阿里云开源镜像站资源目录
  3. Hbase:2.3.7。https://archive.apache.org/dist/hbase/2.3.7/hbase-2.3.7-bin.tar.gz

JDK从Oracle官网下载,hadoop从阿里镜像站下载,hbase从apache存档中下载。Hadoop和Hbase一定要是上面的版本,否则不能联通。官网Apache HBase ™ Reference Guide这里介绍的兼容性有时不对,如本文写作时20220512下载了hadoop3.3.2和hbase2.4.12,二者不能搭配,Hbase启动会报错“java.lang.IllegalArgumentException: object is not an instance of declaring class”。

所有文件下载后解压到如下目录:(setEnv.bat和hadoop-workdir为后续创建)

配置环境

配置环境有两种方式。

 

第一种,设置windows环境变量JAVA_HOME、HADOOP_HOME、HBASE_HOME,并将%JAVA_HOME%\bin、%HADOOP_HOME%\bin、%HADOOP_HOME%\sbin、%HBASE _HOME%\bin、%HBASE _HOME%\conf添加到PATH。此方式优点是可全局方便的调用各命令,缺点是可能会影响到其他应用。

第二种,编写一个批处理,并用批处理启动相应的程序。此方式优点是不影响其他应用,确定是调用命令时需要新设置环境。

下文按第二种方式进行配置。首先在G:\hadoop目录下编写setEnv.bat如下:

echo 设置环境变量

set HADOOP_ROOT=g:\hadoop

set JAVA_HOME=%HADOOP_ROOT%\jdk1.8.0_231

set HADOOP_HOME=%HADOOP_ROOT%\hadoop-3.2.3

set HBASE_HOME=%HADOOP_ROOT%\hbase-2.3.7

set PATH=%JAVA_HOME%\bin;%HADOOP_HOME%\bin;%HADOOP_HOME%\sbin;%HBASE_HOME%\bin;%HBASE_HOME%\conf;%PATH%

配置hadoop

  1. 替换bin目录下的文件,否则windows下无法启动hadoop
    1. https://gitee.com/chen_yu_x/winutils(国内网络较快)或GitHub - cdarlint/winutils: winutils.exe hadoop.dll and hdfs.dll binaries for hadoop windows下载hadoop的windows工具。
    2. 用winutils下hadoop-3.2.2目录下的bin目录,替换%HADOOP_HOME%下的bin目录
  2. 把%HADOOP_HOME%\share\hadoop\yarn\timelineservice\hadoop-yarn-server-timelineservice-3.2.3.jar复制到%HADOOP_HOME%\share\hadoop\yarn\lib目录下, 解决TimelineCollectorManager报错问题。
  3. 修改%HADOOP_HOME%\etc\hadoop\core-site.xml配置文件。注意目录的配置方式。

<configuration>

       <property>

              <name>fs.default.name</name>

              <value>hdfs://localhost:9000</value>

       </property>

       <property>

              <name>hadoop.tmp.dir</name>

              <value>file:/g:/hadoop/hadoop-workdir</value>

       </property>

</configuration>

4. 修改%HADOOP_HOME%\etc\hadoop\hdfs-site.xml配置文件。注意目录的配置方式。

<configuration>

       <property>

              <name>dfs.namenode.name.dir</name>

              <value>file:/g:/hadoop/hadoop-workdir/dfs/name</value>

       </property>

       <property>

              <name>dfs.datanode.data.dir</name>

              <value>file:/g:/hadoop/hadoop-workdir/dfs/data</value>

       </property>

</configuration>

5. 在命令下进入g:\hadoop目录,执行“setEnv.bat”设置环境变量,执行结果示意如下:

       

6. 执行“hdfs namenode -format”对hadoop进行初始化,执行后显示内容示例如下:

   

 

7. 使用“start-all”命令启动hadoop,会显示如下的令行窗口。如有报错参见下文9.a

    

 

8. 查看hadoop启动情况:http://localhost:9870/dfshealth.html#tab-overview

    

 

9. 使用“stop-all”停止hadoop服务。命令行显示如下,其他四个命令行窗口关闭。

    

10. 其他

  1. 如遇内存不足问题,可以修改%HADOOP_HOME%\etc\hadoop\hadoop-env.cmd批处理,在文件开头添加“set HADOOP_HEAPSIZE=200”。
  2. 如果仅为了启动hadoop,也可以跳过第3、4步的配置修改,此时hadoop会在当前盘符下创建tmp文件夹来存储数据。对本例来说是g:\tmp目录。

配置hbase

  1. 复制%HBASE_HOME%\lib\client-facing-thirdparty到%HBASE_HOME%\lib目录下。
  2. 修改%HBASE_HOME%\conf\hbase-site.xml,在configuration下添加如下配置:分别用来指定绑定ip地址和hadoop服务地址。

  ……………………

    <property>

           <name>hbase.master.ipc.address</name>

           <value>0.0.0.0</value>

    </property>

    <property>

           <name>hbase.regionserver.ipc.address</name>

           <value>0.0.0.0</value>

    </property>

<property>

    <name>hbase.rootdir</name>        

    <value>hdfs://localhost:9000/hbase</value>

  </property>

  ……………………

3. 在%HBASE_HOME%\conf\hbase-env.cmd批处理中添加如下配置,让HBase自己进行集群管理。

  ……………………

set HBASE_MANAGES_ZK=true

  ……………………

4.切换到%HBASE_HOME%\bin目录下执行start-hbase。

 4.在命令行下对hbase进行操作

  1. Download下载jansi-1.18.jar,并放到%HBASE_HOME%\lib目录下
  2. 执行“hbase shell”命令,界面示意如下:

         

 

        3. 执行“ create 'test','cf' ”命令,创建表

            

 

6. 点击http://localhost:16010/master-status从浏览器查看hbase运行情况

     

 7. 其他

  1. 使用“stop-hbase”和“hbase master stop --shutDownCluster”命令停止hbase运行。
  2. 在hbase shell界面下用exit命令退出。

参考资料

  1. Apache Hadoop
  2. Apache HBase ™ Reference Guide
  3. Windows环境下hadoop安装和配置详细步骤(图文)_yujkss的博客-CSDN博客_hadoop windows
  4. win10启动hadoop时遇到的坑_coder_szc的博客-CSDN博客
  5. 史上最详细的hadoop安装教程_新生代农民的博客-CSDN博客_hadoop安装
  6. hadoop启动报错: java.lang.NoClassDefFoundError:/org/apache/hadoop/yarn/server/timelineCollectorManager_梁云亮的博客-CSDN博客
  7. hbase与hadoop版本兼容问题,强烈谴责hadoop生态圈耦合性_jinluming19的博客-CSDN博客_hbase版本兼容
  • 2
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Windows上安装HBase,你可以按照以下步骤进行操作: 1. 首先,从Apache存档中下载HBase的适当版本\[1\]。确保下载的版本与你的Hadoop版本兼容。 2. 解压下载的HBase文件到你选择的目录中。 3. 设置环境变量。在Windows上,你需要设置JAVA_HOME、HADOOP_HOME和HBASE_HOME环境变量。将这些变量设置为你的Java、HadoopHBase安装目录的路径。 4. 将%HBASE_HOME%\bin和%HBASE_HOME%\conf添加到系统的PATH环境变量中,以便在任何位置都可以访问HBase的命令和配置文件。 5. 修改%HBASE_HOME%\conf\hbase-site.xml文件,添加必要的配置。根据你的需求,你可能需要指定绑定的IP地址和Hadoop服务地址\[2\]。 6. 如果你使用的是Hadoop集群,请确保Hadoop集群正常运行,并且HadoopHBase的版本兼容。 7. 启动HBase。在命令行中,进入%HBASE_HOME%\bin目录,运行以下命令启动HBase: ``` ./start-hbase.sh ``` 或者 ``` start-hbase.cmd ``` 这将启动HBase的各个组件。 请注意,以上步骤是基于Windows环境下的HBase安装过程\[3\]。确保按照你的具体环境和需求进行相应的调整。 #### 引用[.reference_title] - *1* *2* *3* [在Win10配置hardoophbase](https://blog.csdn.net/godnew/article/details/124853625)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值