- 博客(3)
- 收藏
- 关注
原创 hive中的六种数据连接方式
如图所示,交叉连接就是将右表的每一条数据分别拿出来,配对上左表的每一条数据,然后重复此步骤,直到右表的所有数据完成配对。左外连接就是以左表为主,保留左表的全部数据,把右表配对进来,配对不上的数据用null来进行填充(右表中配对不上的多余数据会被移除)与左外连接相反,右外连接以右表为主,保留右表的全部数据,把左表配对进来,配对不上的数据用null填充(左表中多余数据会被删除)交叉连接的数据条数就是两个表的笛卡尔积(两表数据条数之积),交叉连接后的数据不存在配对关系,其sql甚至不需要指定。
2023-12-06 21:24:34 505 2
原创 数据仓库究竟是什么?
数据库和数据仓库的本质区别就是OLTP系统和OLAP系统的区别。数据库更加侧重于事务处理,对响应速度和安全性要求较高,但对数据的吞吐量要求不大。而数据仓库侧重于数据吞吐量和稳定性,它不需要进行频繁的增删改查,但必须可以处理海量的数据或者文件。
2023-12-05 11:48:18 724 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人