自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 kafka命令

Kafka命令行操作 //启动kafka服务,三台主机分别输入此指令: kafka-server-start.sh $KAFKA_HOME/config/server.properties & //以后台的方式启动 nohup kafka-server-start.sh $KAFKA_HOME/config/server.properties & //查看topic名 k...

2019-11-20 21:17:33 131

原创 集群分发脚本

分发脚本使用前提 配置ip和主机名称的映射 需要让linux01机器知道linux02和linux03代表的是哪个ip 配置SSH无密钥登录(不使用密码登录) (1)在/usr/local/bin目录下创建xsync文件,文件内容如下: cd /usr/local/bin vim xsync #!/bin/bash #1 获取输入参数个数,如果没有参数,直接退出 ...

2019-11-07 22:59:53 164

原创 Hadoop完全分布式集群搭建

准备三台虚拟机 在三台机器的/etc/hosts文件中配置主机名和ip的映射 DEVICE=eth0 #接口名(设备,网卡) HWADDR=00:0C:2x:6x:0x:xx #MAC地址 TYPE=Ethernet #网络类型(通常是Ethemet) UUID=926a57ba-92c6-4231-ba...

2019-11-07 22:58:06 116

原创 Zookeeper安装

0.官网首页: https://zookeeper.apache.org/ 1.集群规划 在hadoop101、hadoop102和hadoop103三个节点上部署Zookeeper。 2.解压安装 1)解压zookeeper安装包到/opt/module/目录下 [root@hadoop101software]$ tar -zxvf zookeeper-3.4.10.tar.gz ...

2019-11-07 22:54:23 118

原创 Hive安装

2.1Hive安装地址 1.Hive官网地址 http://hive.apache.org/ 2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3.下载地址 http://archive.apache.org/dist/hive/ 4.github地址 https://github.c...

2019-11-07 22:50:24 137

原创 Hbase安装

2.1 Zookeeper正常部署 首先保证Zookeeper集群的正常部署,并启动之: [atguigu@hadoop102 zookeeper-3.4.10]$ bin/zkServer.sh start [atguigu@hadoop103 zookeeper-3.4.10]$ bin/zkServer.sh start [atguigu@hadoop104 zookeeper-3....

2019-11-07 22:45:08 184

原创 数据仓库、数据集市、数据湖、传统的数据库

数据仓库与数据湖 当企业从运营系统获得大量数据可用于分析时,他们通常会选择数据仓库或数据湖泊。数据仓库通常作为单一数据源,存储着经过清理和分类的历史数据。数据库中的数据可能不准确,并可能来自企业运营系统之外,它并不适合普通业务分析用户。实际的仓库和湖泊:仓库存储来自特定来源的计划好的货物,而湖泊来自河流、溪流和其他来源,且都是原始内容。 数据仓库和数据集市 数据集市通常是数据仓库的子集,其中的数据...

2019-11-07 18:17:21 458

原创 hive的问题汇总以及问题解析

1.Hive内部表与外部表的区别 未被external修饰的是内部表,被external修饰的是外部表 区别: (1)内部表数据由hive自身管理,外部表数据由HDFS管理 (2)内部表数据存储的位置默认是 (/user/hive/warehouse)外部表数据的存储位置由自己指定 (3)删除内部表会直接删除元数据以及存储数据;删除外部表仅仅会删除元数据 HDFS上的文件不会被删除 (4)对外部表...

2019-11-02 10:15:31 622

原创 Flume 的安装与使用

安装步骤 Flume安装地址 1) Flume官网地址 http://flume.apache.org/ 2)文档查看地址 http://flume.apache.org/FlumeUserGuide.html 3)下载地址 http://archive.apache.org/dist/flume/ 安装部署 1)将apache-flume-1.7.0-bin.tar.gz上传到linu...

2019-11-01 21:31:49 247

原创 hive的排序以及常用的一些函数

全局排序(Order by) 1.按照别名排序 hive (default)> select ename, sal*2 twosal from emp order by twosal; 2.多个列排序 hive (default)> select ename, deptno, sal from emp order by deptno, sal ; 每个MapReduce内部...

2019-11-01 18:14:44 339

原创 sqoop的安装以及数据的导入导出

使用场景 Haoop文件存储体系(HDFS、Hive、Hbase)与关系型数据库(Mysql)之间的数据导入导出。 Sqoop安装 下载并解压 安装Sqoop的前提是已经具备Java和Hadoop的环境。 1) 最新版下载地址:http://mirrors.hust.edu.cn/apache/sqoop/ 2) 上传安装包sqoop-1.4.6.bin__hadoop-2.0...

2019-11-01 18:13:23 103

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除