1、greenplum是一个数据仓库。数据仓库就是用来让我们分析数据的,而数据库是用来为应用进行事实的存储和读取。
2、Greenplum使用的是海量并行处理的架构方式,简称MPP(massively parallel processing),特点就是什么都不共享,各个节点的处理器、内存和总线都是独立的
3、Greenplum的架构:其中,客户端在操作的时候,就感觉是和一个数据库在打交道。在实现上,client也确实是只和master host打交道,master host就是一个入口,sql提交之后,再由 master host 分发给segment host节点,查询之后再返回给master host。里面每个segment host都是一个postGreSql数据库