三分钟入门hive的7个概念

本文介绍了Hive的基本概念,包括它由Facebook开源,作为Hadoop的数据仓库工具,将HDFS上的结构化数据映射为二维表格并提供HQL查询。Hive本质是将SQL转化为MapReduce任务,简化分布式计算程序编写,让用户专注于业务逻辑。
摘要由CSDN通过智能技术生成
1. hive是由Facebook实现并开源的

解决mapreduce编写复杂和学习程度高的问题。

2. hive是hadoop的数据仓库工具

hive是将存储在HDFS上的结构化数据映射为一张二维表格,编写sql语句来统计分析。

结构化数据:csv、tsv
半结构化数据:图片格式、音频格式、视频格式
非结构化数据:html、xml

用一张图来解释:
把存储在HDFS上的结构化数据,通过Hive的sql语句创建数据库表映射为一张二维表格,然后可以写sql语句进行查询分析。
在这里插入图片描述

3. hive存储的数据其实底层是存储在HDFS上

hive本身不存储数据,数据都是存储在HDFS上。

4.hive将HDFS上存储的结构化数据映射成一张二维库表/二维结构

为什么hive提供的是sql的select语法?
因为mysql的表就是一种二维结构,然后我们可以使用sql来操作
针对结构化的数据,其实都可以使用sql的查询分析语句select来进行表达

5.hive提供HQL(hive query language)查询功能

语法和SQL语法有区别,但是大致一样。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值