基于Hadoop的日志收集框架---Chukwa的安装部署

56 篇文章 1 订阅
11 篇文章 0 订阅

chukwa是解决在集群环境中收集各节点增量日志的一种基于hadoop的实现方案,其主要有如下四个组成部分。
1. Agents 运行在每个客户端上,负责发送数据。
2. Collectors 接收Agents发送的数据并写入稳定存储。
3. MapReduce jobs 分析和归档数据。
4. HICC 数据中心,用于显示数据的web界面。
它的系统架构如下图

以单机部署为例,前提已经安装hadoop(0.20.2),HADOOP_HOME=/usr/local/cloud/hadoop

1. 下载chukwa(0.4.0)
2. 解压到/usr/local/cloud/chukwa/,CHUKWA_HOME=/usr/local/cloud/chukwa
3. 修改$CHUKWA_HOME/conf/agents,部署在本机的话为localhost
4. 修改$CHUKWA_HOME/conf/collectors, 部署在本机的话为localhost
5. 修改$CHUKWA_HOME/conf/chukwa-env.sh,设置如下项

Shell代码    收藏代码
  1. export JAVA_HOME=/usr/java/jdk1.6.0_26  
  2. export HADOOP_HOME="/usr/local/cloud/hadoop"  
  3. export HADOOP_CONF_DIR="/usr/local/cloud/hadoop/conf"  
  4. export HADOOP_JAR=${HADOOP_HOME}/hadoop-core-0.20.2.jar  
  5. export chukwaRecordsRepository="/chukwa/repos/"  
  6. export CHUKWA_PID_DIR=/usr/local/cloud/tmp/chukwa/pids  
  7. export CHUKWA_LOG_DIR=/usr/local/cloud/tmp/chukwa/logs  
  8. export CHUKWA_DATA_DIR=/usr/local/cloud/tmp/chukwa/data  

6. 修改$CHUKWA_HOME/conf/chukwa-agent-conf.xml

Xml代码    收藏代码
  1.   <property>  
  2.     <name>chukwaAgent.tags</name>  
  3.     <value>cluster="chukwa"</value>  
  4.     <description>The cluster's name for this agent</description>  
  5.   </property>  
  6.     
  7.   <property>  
  8.     <name>chukwaAgent.control.port</name>  
  9.     <value>9093</value>  
  10.     <description>The socket port number the agent's control interface can be contacted at.</description>  
  11.   </property>  
  12.   
  13.   <property>  
  14.     <name>chukwaAgent.hostname</name>  
  15.     <value>localhost</value>  
  16.     <description>The hostname of the agent on this node. Usually localhost, this is used by the chukwa instrumentation agent-control interface library</description>  
  17.   </property>  
  18.   
  19.   <property>  
  20.     <name>chukwaAgent.checkpoint.name</name>  
  21.     <value>chukwa_agent_checkpoint</value>  
  22.     <description>the prefix to to prepend to the agent's checkpoint file(s)</description>  
  23.   </property>  
  24.     
  25.   <property>  
  26.     <name>chukwaAgent.checkpoint.dir</name>  
  27.     <value>${CHUKWA_LOG_DIR}/</value>  
  28.     <description>the location to put the agent's checkpoint file(s)</description>  
  29.   </property>  
  30.   
  31.   <property>  
  32.     <name>chukwaAgent.checkpoint.interval</name>  
  33.     <value>5000</value>  
  34.     <description>the frequency interval for the agent to do checkpoints, in milliseconds</description>  
  35.   </property>  
  36.   
  37.   <property>  
  38.     <name>chukwaAgent.sender.fastRetries</name>  
  39.     <value>4</value>  
  40.     <description>the number of post attempts to make to a single collector, before marking it failed</description>  
  41.   </property>  
  42.   
  43.   <property>  
  44.     <name>chukwaAgent.collector.retries</name>  
  45.     <value>144000</value>  
  46.     <description>the number of attempts to find a working collector</description>  
  47.   </property>  
  48.   
  49.   <property>  
  50.     <name>chukwaAgent.collector.retryInterval</name>  
  51.     <value>20000</value>  
  52.     <description>the number of milliseconds to wait between searches for a collector</description>  
  53.   </property>  

7. 修改$CHUKWA_HOME/conf/chukwa-collector-conf.xml

Xml代码    收藏代码
  1. <property>  
  2.    <name>writer.hdfs.filesystem</name>  
  3.    <value>hdfs://master:9000/</value>  
  4.    <description>HDFS to dump to</description>  
  5.  </property>  
  6.   
  7.  <property>  
  8.    <name>chukwaCollector.outputDir</name>  
  9.    <value>/chukwa/logs/</value>  
  10.    <description>Chukwa data sink directory</description>  
  11.  </property>  
  12.   
  13.  <property>  
  14.    <name>chukwaCollector.rotateInterval</name>  
  15.    <value>300000</value>  
  16.    <description>Chukwa rotate interval (ms)</description>  
  17.  </property>  
  18.   
  19.  <property>  
  20.    <name>chukwaCollector.http.port</name>  
  21.    <value>8080</value>  
  22.    <description>The HTTP port number the collector will listen on</description>  
  23.  </property>  

8. 修改$CHUKWA_HOME/conf/initial_adaptors,添加要监测的日志文件,比如

Shell代码    收藏代码
  1. add filetailer.CharFileTailingAdaptorUTF8 TestLog1 0 /home/matrix/Program/project/log/testlog1 0  

9. 启动collectors

Shell代码    收藏代码
  1. $CHUKWA_HOME/bin/start-collectors.sh  

10. 启动agents

Shell代码    收藏代码
  1. $CHUKWA_HOME/bin/start-agents.sh  

11. 启动data-processors

Shell代码    收藏代码
  1. $CHUKWA_HOME/bin/start-data-processors.sh  
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 安装 Hadoop-Eclipse-Plugin 可以让你在 Eclipse 中方便地开发和管理 Hadoop 任务。以下是安装步骤: 1. 下载 Hadoop-Eclipse-Plugin,可以从 Apache 官网或其他镜像站点下载。 2. 打开 Eclipse,选择 Help -> Install New Software。 3. 点击 Add 按钮,输入 Name 和 Location,然后点击 OK。 4. 在 Work with 下拉列表中选择 Hadoop Plugin Site。 5. 在下方列表中勾选 Hadoop Plugin,然后点击 Next。 6. 确认安装选项,然后点击 Next。 7. 接受许可协议,然后点击 Finish。 8. 安装过程可能需要几分钟时间。安装完成后,重启 Eclipse。 9. 在 Eclipse 中打开 Preferences 对话框,选择 Hadoop。 10. 输入 Hadoop 安装路径和 Hadoop 核心库路径,然后点击 Apply。 11. 现在你可以在 Eclipse 中创建 Hadoop 项目和任务,并在本地或集群上运行它们了。 注意:安装 Hadoop-Eclipse-Plugin 前需要先安装 Hadoop 和 Eclipse。 ### 回答2: 在安装 Hadoop-Eclipse-Plugin之前,首先需要确保已经安装了Eclipse IDE。接下来,我们需要按照以下步骤来安装Hadoop-Eclipse-Plugin。 首先,我们需要下载Hadoop-Eclipse-Plugin的安装文件。可以在Hadoop官方网站或者其他可信的网站上找到该插件的下载链接。 下载完成后,打开Eclipse IDE。在Eclipse的菜单栏中选择“Help” -> “Eclipse Marketplace”。 在弹出的对话框中,点击左上角的搜索框,并输入“Hadoop-Eclipse-Plugin”。然后点击“Go”按钮进行搜索。 在搜索结果中找到Hadoop-Eclipse-Plugin,点击“Go”按钮旁边的“Install”按钮。接下来会弹出一个安装对话框。 在安装对话框中,会显示有关Hadoop-Eclipse-Plugin的详细信息。点击“Next”继续安装。 接下来,阅读并接受许可协议,然后点击“Finish”按钮。 安装过程可能需要一段时间,等待安装完成后,点击“Restart Now”按钮重启Eclipse IDE。 重启后,Hadoop-Eclipse-Plugin已经成功安装。可以通过Eclipse的菜单栏选择“Window” -> “Show View” -> “Other”,然后在弹出的对话框中选择“Hadoop”来打开Hadoop-Eclipse-Plugin视图。 通过Hadoop-Eclipse-Plugin的视图,可以方便地管理和操作Hadoop集群,包括上传和下载文件,提交和监控MapReduce任务等。 安装Hadoop-Eclipse-Plugin后,可以更加方便地开发和调试Hadoop应用程序,提高工作效率。 ### 回答3: 安装 Hadoop-Eclipse-Plugin 是为了在 Eclipse IDE 中方便地使用 Hadoop 大数据处理框架。 首先,确保已经安装并配置好了以下软件: 1. JDK:Hadoop 需要使用 Java 开发环境,确保安装了合适版本的 JDK。 2. Eclipse:安装最新版本的 Eclipse IDE。 接下来,按照以下步骤安装 Hadoop-Eclipse-Plugin: 1. 打开 Eclipse,选择 “Help” 菜单,然后选择 “Eclipse Marketplace”。 2. 在 “Eclipse Marketplace” 对话框中搜索 “Hadoop Plugin”,然后点击搜索结果中的 “Hadoop Plugin”。 3. 点击右侧的 “Go to the Project” 按钮,进入 Hadoop-Eclipse-Plugin 的项目页面。 4. 在项目页面中,找到适合你当前版本的插件,并点击右侧的 “Download” 按钮下载插件。 5. 下载完成后,返回到 Eclipse,选择 “Help” 菜单,然后选择 “Install New Software”。 6. 点击 “Add” 按钮,添加插件的本地文件或从网络上选择插件文件,然后点击 “OK”。 7. 在 “Work with” 框中选择下载好的插件,然后点击 “Next”。 8. 在安装对话框中勾选 “I accept the terms of the license agreement” 选项,然后点击 “Finish”。 9. 安装过程可能需要一些时间,完成后会提示重启 Eclipse。 安装完成后,插件将会添加到 Eclipse 的插件列表中。你可以在 Eclipse 的 “Window” 菜单下找到 “Hadoop” 相关的选项,通过它们来管理和运行 Hadoop 任务。 注意:在安装插件之前,请确保你已经正确地配置了 Hadoop 环境,并已经正确安装Hadoop。插件的版本应与你当前 Hadoop 版本兼容,否则可能导致插件无法正常工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值