1、 Hive核心概念和架构原理
1.1、 Hive概念
Hive由FaceBook开发,用于解决海量结构化日志的数据统计。
Hive是基于Hadoop的数据仓库工具,可以将结构化数据映射为一张表,提供类似SQL语句查询功能
本质:将Hive SQL转化成MapReduce程序。
![2f9c6b3fa99d6acf704377fb632a8bdf.png](https://i-blog.csdnimg.cn/blog_migrate/f2cb5ae2df689d5762d95a816dfb0810.png)
1.2、Hive与数据库的区别
![6698374ed1fdca22061b71fa879dcf32.png](https://i-blog.csdnimg.cn/blog_migrate/ed1def7f882984cc09ac01fea16e6ad2.jpeg)
读时模式:Hive在加载数据到表中的时候不会校验.
写时模式:Mysql数据库插入数据到表的时候会进行校验.
总结:Hive只适合用来做海量离线的数据统计分析,也就是数据仓库。
1.3、Hive的优缺点
优点:操作接口采用了类SQL语法,提供快速开发的能力,避免了去写MapReduce;Hive还支持用户自定义函数,用户可以根据自己的需求实现自己的函数。
缺点:Hive不支持纪录级别的增删改操作;Hive查询延迟很严重;Hive不支