1966年
- geoHash出现
1970年
- B树
Organization and Maintenance of Large Ordered Indices 一文中提出的[1]。它采用多叉树结构,降低了索引结构的深度,避免传统二叉树结构中绝大部分的随机访问操作,从而有效减少了磁盘磁头的寻道次数,降低了外存访问延迟对性能的影响。它保证树节点中键值对的有序性,从而控制search/insert/delete/update操作的时间复杂度在O(log(n))的范围内 - 布隆过滤器
布隆过滤器(Bloom Filter)1970年由布隆提出。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有一定的误识别率和删除困难。 - 关系型数据库
Codd划时代的论文《用于大型共享数据库的关系数据模型》
1973年
- B+树
1973年 一种特殊的B树,只有叶子结点才存储完整数据 不存在某篇论文把B+树的定义给出来,最早的研究始于1973年IBM关于VSAM 软件(VSAM:虚拟存储访问方法是IBM的磁盘文件存储访问方法) 发表的文章。
1979年
- oracle
第一个商用关系型数据库oracle发布
1984年
- R树
R树是由Antonin Guttman于1984年提出的。 人们随后发现它在理论和应用方面都非常实用。 在现实生活中,R树可以用来存储地图上的空间信息,例如餐馆地址,或者地图上用来构造街道,建筑,湖泊边缘和海岸线的多边形。公司的LBS服务基本上都是基于R树进行构建的。
1989年
- 跳表出现
1995年
- MySQL出现,并在5.5.8版本后默认使用InnoDB最为存储引擎。
1996年
- PostgreSQL出现。
20世纪末
- 出现全文检索概念。
1999年
- Lucene开源。
2000年
- SQLite出现。
2003年
- Google发表论文《The Google File System》。
- Memcached开源。
- Neo4j开始开发,并于2007年开源。
2004年
- 在《Google File System》启发下,HDFS出现。
- Google发表论文《MapReduce: Simplified Data Processing on Large Clusters》。
2005年
- 在《MapReduce: Simplified Data Processing on Large Clusters》启发下,Hadoop MapReduce实现出现。
2006年
- Google发表论文《Bigtable: A Distributed Storage System for Structured Data》。
- 在论文《Bigtable: A Distributed Storage System for Structured Data》启发下,HBase出现,并于2010年成为Apache顶级项目。
- 亚马逊提供S3对象存储服务。
2008年
- HIVE出现。
2009年
- NoSQL概念被提出。
- Redis开源。
- MongoDB开源。
2010年
- Spark开源,并于2014年成为Apache顶级项目。
- ElasticSearch开源。
2011年
- Flink开源,并于2014年成为Apache顶级项目。
2012年
- LevelDB开源。
2013年
- RocksDB出现。
- Google发表论文《F1: A Distributed SQL Database That Scales》。
- Google发表论文《Spanner: Google’s Globally Distributed Database》。
- 出现由Google引领的NewSQL风格架构和由PostgreSQL发展出的PGXC风格架构。
2017年
- Google发表论文《Spanner: Becoming a SQL System》。
- CockroachDB发布。
- TiDB发布。
2018年
- Google发表论文《F1 Query: Declarative Querying at Scale》。
2020年
- CockroachDB发表的论文《CockroachDB: The Resilient Geo-DistributedSQL Database》。
2021年
- OceanBase开源。