HIVE中的表操作

表的种类 1.内部表 2.外部表 3.分区表 4.分通表 扩展: 临时表 只有在进程中有效 进程结束 表所有数据删除 与内部表类似 表的操作 show databases ----- 查看数据库 show tables -----查看表 use 数据库名----进入数据库 dr...

2019-06-20 21:26:04

阅读数 17

评论数 1

HIVE入门

Hive简介: Hive是一个构建于Hadoop顶层的数据仓库工具,可以查询和管理PB级别的分布式数据。 支持大规模数据 存储、分析,具有良好的可扩展性 某种程度上可以看作是用户编程接口,本身不存储和处理数据。 依赖分布式文件系统HDFS存储数据。 依赖分布式并行计算模型MapRedu...

2019-06-20 08:54:52

阅读数 25

评论数 1

zookeeper原理

zookeeper zookeeper 是一个分布式协调服务 配置 上传zookeeper.jar包 解压 修改 zookeeper下的zoo.cfg dataDir= 设置自己的目录 -------是数据目录路径 配置节点: server.1=node01:2...

2019-06-18 20:48:32

阅读数 29

评论数 0

Mapreduce分布式处理

mapreduce Mapreduce是Hadoop的核心框架之一 Mapreduce是分布式处理的框架 HDFS与MApreduce最大的特点就是分布式 简单的说一个庞大的数据 用一台计算机完成不了的计算数据 交给了多台计算机一起计算 最后合并各个计算机的结果 输出结果 mapred...

2019-06-14 21:27:16

阅读数 58

评论数 2

hadoop在eclipse搭建(搭建外部)

hadoop在eclipse搭建 首先 你需要有eclipse jdk 其次 需要配置在windon中配置hadoop变量 和jdk环境变量 配置jdk环境变量 配置hadoop环境变量 编辑path中添加hadoop环境变量值 配置eclipse环境 配置eclipse...

2019-06-13 21:18:10

阅读数 26

评论数 0

伪分布式搭建

伪分布式搭建 伪分布式: 就是所有角色在一个节点上 创建虚拟机 设置本台虚拟机名称 vi /etc/sysconfig/network 如图: 修改网络配置信息 vi /etc/sysconfig/network-scripts/ifcfg-eth0如图: IPADDR:设置ip地址(集...

2019-06-12 15:51:51

阅读数 15

评论数 1

SencondaryNamenode介绍

SencondaryNamenode作用 sencondaryNamenode :将Namenode(主节点的)中的mateData元数据 edits.log 和fsimage的文件合并,并写入到磁盘中,为保证数据的安全------持久化操作备注:secodarynode永远无法代替Namenod...

2019-06-11 21:30:47

阅读数 40

评论数 0

大数据 HDFS(分布式文件系统)简单介绍

大数据简单入门 大数据时代 最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“ 数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。 人们对于 海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余 浪潮的到来。 ” “大...

2019-06-10 20:24:15

阅读数 325

评论数 0

linux简单入门

linux学习 Linux操作系统是基于UNIX操作系统发展而来的一种克隆系统,它诞生于1991 年的 [Linux桌面] 10 月5 日(这是第一次正式向外公布的时间)。以后借助于Internet网络,并通过全世界各地计算机爱好者的共同努力,已成为今天世界上使用最多的一种UNIX 类操作系统,...

2019-06-10 15:01:57

阅读数 28

评论数 0

提示
确定要删除当前文章?
取消 删除