Hive与传统数据库的区别

最新推荐文章于 2024-07-27 10:15:09 发布

weixin_33901843

最新推荐文章于 2024-07-27 10:15:09 发布

阅读量298

点赞数

文章标签：数据库大数据数据结构与算法

原文链接：https://my.oschina.net/134596/blog/1798983

版权

为什么80%的码农都做不了架构师？>>>

1.传统数据库对表数据的验证是 schema on write(写时模式)，而Hive在load时是不检查数据是否符合schema的，Hive遵循的是schema on read(读时模式)，只有在读的时候hive才检查、解析具体的数据字段、schema。读时模式的优势是load data非常迅速，因为它不需要读取数据进行解析，仅仅进行文件的复制或者移动。写时模式的优势是提升了查询性能，因为预先解析之后可以对列建立索引，并压缩，但这样也会花费更多的加载时间。即使为内部表在数据加载时也不解析数据格式，如果数据和模式不匹配，只能在查询时出现null才知道有不匹配的行。

2.hive具有复杂数据结构（数组、映射、结构体）。

3.hive不支持实时数据处理，对索引的支持较弱。

4.hive不支持行级的插入。

5.延迟高，数据量大，多存储在hdfs上。

6.执行为mapreduce。

7.hive不支持行级操作也不支持事务。

转载于:https://my.oschina.net/134596/blog/1798983