各位工程师同学们:
你好,
如果你在从事后端开发,你也许曾幻想过设计出性能比标准库还高数倍的数据结构或者算法;
如果你在从事存储系统开发,你也许曾幻想过实现一种全新的存储模式,大幅提升读取和写入速度;
如果你在从事大数据平台开发工作,你也许曾幻想过打造一个全新的SQL engine,性能超过Spark和Presto的5-10倍以上;
如果你在从事分布式数据库系统开发,你也许曾幻想过设计一个比Aurora和Snowflake更领先的云原生架构;
如果你在从事ClickHouse系统开发,你也许曾幻想过给它设计一个真正的MPP分布式计算架构;
我们真的能实现这些连世界顶级专家们都还没有实现的“幻想”吗?也许你曾经的答案是“不可能”。
十年前,整个大数据分析领域都处于Hive时代,Spark/Presto/Impala还没有诞生。当时的百度凤巢需要支持广告主进行快速灵活的OLAP多维分析,并且需要支持实时,还需要支持高并发。于是,一群工程师有了一个疯狂的想法:抛弃Hadoop,从零打造一个全新的MPP分析型数据库Doris!
从2010年以后,当整个互联网都在大力研发Hadoop大数据平台时,这群人却始终相信新型MPP分析型数据库才是未来,不断埋头研发和改进Doris,一干就是十年。在2018年进入Apache基金会后,Apache Doris迅速成为了很多大型互联网厂商的数据分析平台