hive就是一个mr的客户端
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/4d893e87dd1eb24852f3bca4f3f79792.png)
mapreduce为什么慢
反复的将数据从磁盘到内存,从内存到磁盘的读取写入操作(spark从头到尾都在内存中,所以比MR快)
1. 首先读取hdfs的数据到map的环形内存缓冲区
2. 缓冲区形成小文件到reduce的内存
3. reduce从内存落入磁盘
hive的数据时存储在hdfs上面,而且hive支持各种存储格式
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/aeb81a4900782ee5178dccd507ebc644.png)
注意:
千万别把hive当做数据库来用,hive是用来做数据仓库的
现在版本的hive支持插入,不支持修改,删除操作,最主要的功能就是查询,是对已经发生的事情进行处理的