- 博客(11)
- 收藏
- 关注
原创 kafka命令
Kafka命令行操作 //启动kafka服务,三台主机分别输入此指令: kafka-server-start.sh $KAFKA_HOME/config/server.properties & //以后台的方式启动 nohup kafka-server-start.sh $KAFKA_HOME/config/server.properties & //查看topic名 k...
2019-11-20 21:17:33 131
原创 集群分发脚本
分发脚本使用前提 配置ip和主机名称的映射 需要让linux01机器知道linux02和linux03代表的是哪个ip 配置SSH无密钥登录(不使用密码登录) (1)在/usr/local/bin目录下创建xsync文件,文件内容如下: cd /usr/local/bin vim xsync #!/bin/bash #1 获取输入参数个数,如果没有参数,直接退出 ...
2019-11-07 22:59:53 164
原创 Hadoop完全分布式集群搭建
准备三台虚拟机 在三台机器的/etc/hosts文件中配置主机名和ip的映射 DEVICE=eth0 #接口名(设备,网卡) HWADDR=00:0C:2x:6x:0x:xx #MAC地址 TYPE=Ethernet #网络类型(通常是Ethemet) UUID=926a57ba-92c6-4231-ba...
2019-11-07 22:58:06 116
原创 Zookeeper安装
0.官网首页: https://zookeeper.apache.org/ 1.集群规划 在hadoop101、hadoop102和hadoop103三个节点上部署Zookeeper。 2.解压安装 1)解压zookeeper安装包到/opt/module/目录下 [root@hadoop101software]$ tar -zxvf zookeeper-3.4.10.tar.gz ...
2019-11-07 22:54:23 118
原创 Hive安装
2.1Hive安装地址 1.Hive官网地址 http://hive.apache.org/ 2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3.下载地址 http://archive.apache.org/dist/hive/ 4.github地址 https://github.c...
2019-11-07 22:50:24 137
原创 Hbase安装
2.1 Zookeeper正常部署 首先保证Zookeeper集群的正常部署,并启动之: [atguigu@hadoop102 zookeeper-3.4.10]$ bin/zkServer.sh start [atguigu@hadoop103 zookeeper-3.4.10]$ bin/zkServer.sh start [atguigu@hadoop104 zookeeper-3....
2019-11-07 22:45:08 184
原创 数据仓库、数据集市、数据湖、传统的数据库
数据仓库与数据湖 当企业从运营系统获得大量数据可用于分析时,他们通常会选择数据仓库或数据湖泊。数据仓库通常作为单一数据源,存储着经过清理和分类的历史数据。数据库中的数据可能不准确,并可能来自企业运营系统之外,它并不适合普通业务分析用户。实际的仓库和湖泊:仓库存储来自特定来源的计划好的货物,而湖泊来自河流、溪流和其他来源,且都是原始内容。 数据仓库和数据集市 数据集市通常是数据仓库的子集,其中的数据...
2019-11-07 18:17:21 458
原创 hive的问题汇总以及问题解析
1.Hive内部表与外部表的区别 未被external修饰的是内部表,被external修饰的是外部表 区别: (1)内部表数据由hive自身管理,外部表数据由HDFS管理 (2)内部表数据存储的位置默认是 (/user/hive/warehouse)外部表数据的存储位置由自己指定 (3)删除内部表会直接删除元数据以及存储数据;删除外部表仅仅会删除元数据 HDFS上的文件不会被删除 (4)对外部表...
2019-11-02 10:15:31 622
原创 Flume 的安装与使用
安装步骤 Flume安装地址 1) Flume官网地址 http://flume.apache.org/ 2)文档查看地址 http://flume.apache.org/FlumeUserGuide.html 3)下载地址 http://archive.apache.org/dist/flume/ 安装部署 1)将apache-flume-1.7.0-bin.tar.gz上传到linu...
2019-11-01 21:31:49 247
原创 hive的排序以及常用的一些函数
全局排序(Order by) 1.按照别名排序 hive (default)> select ename, sal*2 twosal from emp order by twosal; 2.多个列排序 hive (default)> select ename, deptno, sal from emp order by deptno, sal ; 每个MapReduce内部...
2019-11-01 18:14:44 339
原创 sqoop的安装以及数据的导入导出
使用场景 Haoop文件存储体系(HDFS、Hive、Hbase)与关系型数据库(Mysql)之间的数据导入导出。 Sqoop安装 下载并解压 安装Sqoop的前提是已经具备Java和Hadoop的环境。 1) 最新版下载地址:http://mirrors.hust.edu.cn/apache/sqoop/ 2) 上传安装包sqoop-1.4.6.bin__hadoop-2.0...
2019-11-01 18:13:23 103
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人