一、从数据库到数据仓库再到混合数据库
1.1 数据库vs数据仓库vs混合数据库vs数据湖
场景 | 典型代表 | 主要优缺点 | |
数据库 | OLTP | 三大数据库(Oracle、MySQL、SQLServer) | OLTP支持的非常好,OLAP支持弱 |
数据仓库 | OLAP | Teradata、Greenplum、Hive+HDFS、ClickHouse、Kylin | OLAP支持的非常好,OLTP不支持或者支持弱 |
混合数据库 | HTAP=OLTP+OLAP | Kudu(先OLAP在OLTP)、TiDB(先OLTP在OLAP) | OLTP+OLAP都支持但都为支持到极 致,折中方案嘛,毕竟是有所取舍 |
数据湖 | HTAP+(增强版) | Hudi、Iceberg、DeltaLake | 除了HTAP的一些场景,还能支持各种格式 |
1)、数据库 DataBase,⼀般简称 DB,主要是做 OLTP(online transaction processing),即在线的交易的增删 查改,强调事物和⾼并发。⼀般数据库采⽤⾏存储。
2)、数据仓库 Data Warehouse,简称 DW,主要是来做OLAP(online analytics processing),也就是在线数据 分析,⽤于数据分析场景。⼀般数据仓库采⽤列存储