kudu&impala总结

本文详细介绍了Kudu的背景和架构,以及Kudu的安装部署过程,包括配置本地YUM源。接着阐述了Impala的组成部分和服务,以及Impala的安装步骤。在遇到的问题部分,列举了Kudu启动问题和Impala整合时的错误排查。最后,展示了如何在IDE中整合Kudu和Impala,进行Kudu表的操作。
摘要由CSDN通过智能技术生成
  • kudu简介
  • kudu安装部署
  • 使用过程中遇到的问题总结
  • kudu和impala整合,在IDE中实现对kudu表的操作
    (不断整理,持续更新)

1_kudu简介

1)什么是kudu?

官网:https://kudu.apache.org/
官网定义:Kudu is a columnar storage manager developed for the Apache Hadoop platform. Kudu shares the common technical properties of Hadoop ecosystem applications: it runs on commodity hardware, is horizontally scalable, and supports highly available operation.翻译过来就是:kudu是一个运行在hadoop平台的列式存储工具 ,kudu拥有hadoop生态圈的特性:它运行在商业硬件上,横向扩展性好,支持高可用。
hadoop的存储工具有很多,hbase,hdfs等,那为什么还有kudu呢?这是因为hdfs适合静态数据的离线分析(一次写入,多次读取),它的吞吐量很大,但同时数据延迟性大;而hbase刚好相反,它适合动态数据的快速分析,但是数据吞吐量小。
此时就需要一款基于频繁更新数据同时能快速分析的工具——Kudu.

2)kudu架构

在这里插入图片描述

3)KUDU 中存在两个角色:

1_Mater Server:负责集群管理、元数据管理等功能
2_Tablet Server:负责数据存储,并提供数据读写服务

2_kudu安装部署

1)配置本地yum源

为什么要配置本地yum源?
linux安装软件最常用的方式是tar包和rpm包安装,但是有一些软件(比如impala)cloudera公司没有提供tar包,所以我们只能采用rpm包下载。但是一个rpm包可能会依赖很多rpm包,要找全所需要的rpm包很麻烦,yum可以帮我们指定的服务器自动下载rpm包并且安装,可以自动处理依赖性关系。配置本地yum源就是提前把所有rpm包下载到本地,需要的时候直接从本地库下就好,无需依赖网络。
说白了就是为了方便安装impala,和kudu整合。
下载所有的rpm包:
下载地址:(找对版本)http://archive.cloudera.com/cdh5/repo-as-tarball/5.14.0/cdh5.14.0-centos6.tar.gz
配置本地yum源:
解压到指定文件夹,我放在/export/servers下了。
在这里插入图片描述
镜像源是centos当中下载相关软件的地址,我们可以通过制作我们服务器自己的镜像源指定我们去哪里下载rpm包,这里我们使用httpd这个软件来作为服务端,启动httpd的服务来作为我们镜像源的下载地址。

yum  -y install httpd
service httpd start

编译yum仓库配置文件:

cd /etc/yum.repos.d
vim localimp.repo

配置文件如下:

[localimp]
name=localimp
baseurl=http://node03/cdh5.14.0/
gpgch
  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值