三分钟教会你认识hive以及安装hive,快进来学习点赞吧

本文详细介绍了Hive的发展历程、特点、与数据库的区别,以及Hive的安装步骤和启动过程。通过类SQL的HQL语言,Hive提供了对大数据的便捷分析,但其运行效率相对较低。在安装部分,文章涵盖了从解压安装包到配置环境变量、连接MySQL数据库的全过程,并提示了权限设置的重要性。
摘要由CSDN通过智能技术生成

一、hive

1.发展史:
07年8月 – 始于Facebook
13年5月 – 0.11 Stinger Phase 1 ORC HiveServer2
13年10月 – 0.12.0 Stinger Phase 2 - ORC improvement
14年4月 – Hive 0.13.0 as Stinger Phase 3
14年11月 – Hive 0.14.0
15年2月 – Hive 1.0.0
15年5月 – Hive 1.2.0
16年2月 – Hive 2.0.0 (添加 HPLSQL, LLAP)
16年6月 – Hive 2.1.0

2.简介:
将结构化的数据文件映射为数据库表
提供类sql的查询语言HQL(Hive Query Language)
本质:将sql语句转换为MapReduce任务进行运行( 记住 ),本质上就是MapReduce
作用: 对海量的大数据(结构化) 数据进行分析和统计
区别:MapReduce执行效率更快 -----------Hive开发效率更快

3.优点:
Hive使用HQL实现对数据的操作,操作方便简单(比MapReduce操作方便)
Hive处理大数据(比MySQL/Oracle强大)
Hive提供的大量的工具
Hive支持自定义函数,使用自定义需求
Hive实现离线数据分析
缺点:Hive运行效率较低(延迟高,离线数据分析)


hadoop hive 离线
hadoop hbase 离线 实时
hadoop spark 实时


4.hive与数据库的区别:
Hive不是数据库
能够使用类SQL对数据进行查询操作(和数据库的相同点)

Hive中没有索引(暴力扫描整张表 , 访问数据延迟高;使用MR,并行访问数据)

Hive操作的数据是在分布式文件系统(HDFS)上的数据

Hive使用类SQL语言,功能更加的强大(分布式集群数据)

Hive不支持数据的修改

二、hive结构

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值