Hive、MR 一些简单笔记

Hive是数据库文件管理组件

Hive中存储的数据是以文件的形式存储,当使用Hive语法时(非常类似与SQL),Hive会呗转换成可执行的MapReduce作业,自动去执行

 

Hive的内容例子:

  1,张三,男

  2,李四,女

其中,“,”字段分割规则,在建表时定义,其他的“1”,“张三”,“男”都是字段的内容,这些所有数据都是以文件的形式存储

 一个表对应着一个文件,一个数据库对应着一个文件目录

当需要对数据进行检索时,将数据变成文件然后导入到Hive的表中,使用Hive命令检索

 

需要注意的是:导入到Hive的表中需要在Hive的指定数据库(目录)下,这样要么成了copy,要么成了移动,先说copy,如果文件特变大,几个T甚至PB就不合理,所以只能是移动(对于是网盘系统的话,就需要修改文件的指定路径),或者是在设计初期就要将此问题考虑进来

MR只对文件文件内容做处理

转载于:https://www.cnblogs.com/onone/articles/8494554.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值