Hive和传统数据库的比较

最新推荐文章于 2022-12-22 08:00:00 发布

敲代码der

最新推荐文章于 2022-12-22 08:00:00 发布

阅读量2.5k

点赞数 2

分类专栏：数据分析

本文链接：https://blog.csdn.net/qq_36261130/article/details/100989351

版权

5 篇文章 0 订阅

订阅专栏

查询语言不同：HiveSQL是HQL语言，传统SQL是SQL语句；
数据存储位置不同：HiveSQL是把数据存储在HDFS上，而传统SQL数据是存储在块设备或者本地文件；
数据格式：HiveSQL数据格式可以用户自定义，传统SQL有自己的系统定义格式(不同的数据库有不同的存储引擎)；如: 年龄字段age在Hive中可以定义为INT,STRING,DOUBLE,定义什么型都可以,即使为STRING也可以做运算(加减乘除),在SQL只能存为数值型,STRING型排序规则是按照第一个字符进行排序
数据更新：hive不支持数据记录更新，只可以读，不可以写，而sql支持数据更新；如: 只改某一条数据的某个字段值, 在Hive中是不可以的, 只能将整个表重新导入更新
索引：hive没有索引，因此查询数据的时候是通过mapreduce很暴力的把数据都查询一遍，也造成了hive查询数据速度很慢的原因，而mysql有索引；
延迟性：hive延迟性高，原因就是上边一点所说的，而mysql延迟性低；
数据规模：hive存储的数据量超级大，而mysql只是存储一些少量的业务数据；
底层执行原理：hive底层是用的mapreduce(启动需要时间准备)，而mysql是excutor执行器；
可扩展性：HiveSQL高而传统SQL较低

关注