数据湖的终极形态会到来。随着Snowflake的IPO,对象存储与分布式计算引擎的组合引起关注。其中,OBS(对象存储)作为Hadoop的出入口和扩容方案,将会是Hadoop发展的必然路线,直至OBS成为云存储中心而Hadoop被边缘化,也就意味着当前主流数据湖定义的会被更新,可能会出现基于OBS的硬件形态数据湖产品,此趋势也反映在Cloudera对Ozone的消极态度和IceBerg的热度上。
基于分布式架构设计的数据库产品。随着云原生的状态容器技术(类似Istio)成熟,通过编排器、状态容器、分布式事务、分布式文件系统的组合,一定会出现类MySQL方案,通过分布式设计冲击Oracle、IBM和Teradata的核心市场。例如TiDB,在遵守MySQL协议的基础上,借助云原生技术,设计TP(事务处理)类数据库,从而实现在性能线性扩展基础上保证已有生态兼容。
小规模数据库私有云产品将会普及。类似当年中心机房租赁向机房私有化的发展过程,公有云并不能完全替代私有的存算需求,同时,状态化容器技术的成熟,将会催熟数据库自动管理技术,从而出现通过算力和存储冗余,基于廉价硬件,实现能接受的可靠性条件下的数据库私有云产品,形态上类似于微型阿里云或者复合功能的数据库一体机,其核心竞争力是低运维门槛和硬件的可维护性。