数据库简史:80 岁的图灵奖得主和 5 年一次的长老会

墨天轮2023年11月份的报告已经出炉,这一期的主题是:鲲鹏展翅,擘画未来。在公众号回复:下载  可以获得各期报告下载链接。

鲲鹏展翅,是因为我近期作为评委参加了“2023 鲲鹏应用创新大赛”,将其中 openGauss 赛道的作品,摘要进行分享,以期望更多的人了解和参与到 openGauss的社区创新中来;擘画未来,是因为10 月在波士顿举办了数据库会议,李国良教授第一时间将大会内容分享出来,我进行了摘要,将“波(擘)”士顿一批专家共“话(画)“的数据库未来呈现给大家。

83505d4d0f1ed641701e45ff323720af.png

【波士顿数据库会议】

2023 年 10 月 19-20 日,由麻省理工学院(MIT)主办的波士顿数据库会议成功举办,45 位全球数据库研 究人员在麻省理工学院集思广益,共同探讨数据库的发展未来。自1988年开始,来自全球学术界的研究人员, 每5年一次,头脑风暴,探讨数据库的未来,这被视为数据库领域的长老会。

2023 年波士顿会议由 Anastasia Ailamaki(洛桑联邦理工学院)和 Samuel Madden(麻省理工学院)精心 组织。每个人都做了 5 分钟的发言。马克-希尔(Mark Hill)和马泰-扎哈里亚(Matei Zaharia)两人做了长 达一小时的主题发言。会议还举行了两场小组讨论和多次讨论。

这一届大会最年长的参与者应属Michael Stonebraker,他出生于 1943 年 10 月 11 日,今年已经年届八十。大会为他祝贺了生日。在下图大合影中,看看大家能用几秒找到他

中国受邀参会的学者是来自清华大学的李国良教授。图中左起第三位。他是中国大陆首位被邀请参会的学者。本节内容来自李国良教授的在线分享。

4084a63c8384218ec84863153c5e08e8.jpeg

Stonebraker 教授在 2014 年获得了图灵奖,他是数据库领域四位图灵奖获得者中,唯一一位仍然在世的技术天才。

1973 年,当 IBM 启动 System R 项目时,研究团队发表了一系列论文,介绍了他们正在构建的系统。伯克利的两位科学家 Michael Stonebraker 和 Eugene Wong 在阅读了这些论文后对这一概念产生了兴趣,并开始了他们自己的关系数据库研究项目,这个项目就是Ingres,Ingres大约在1974 年开发出早期原型,随后进行了重大修改,使代码具有可维护性。随后,Ingres 被推广到一个小型用户社区,项目成员反复重写原型,以吸收积累的经验、用户反馈和新想法。该研究项目于 1985 年结束。

与 System R 不同的是,Ingres 的源代码(在磁带上)只收取象征性的费用。到 1980 年,已经分发了大约 1000 份拷贝,主要面向大学。许多使用过 Ingres 源代码的加州大学伯克利分校和其他大学的学生都从事过各种商业数据库软件系统的工作。

由 Ingres 开始的数据库创新历程,支撑起数据库领域的半壁江山。与其有关的数据库产品包括,Informix、Sybase、SQL Server、Nonstop SQL、PostgreSQL、Vertica、VoltDB等。

David J. Dewitt 曾经写到:“回想起来,我们仍然很难理解,一个毕业论文探讨随机马尔可夫链数学、没有任何构建软件工件经验、编程能力有限(实际上我认为是没有)的研究生,是如何最终帮助启动了整个计算机科学研究的新领域,以及一个年收入 500 亿美元的产业的。”

Stonebraker 的传奇至今不息。

本次会议的 45 位研究人员分布在以下 国家: 中国、法国、德国、希腊、荷 兰、新加坡、瑞士和美国。

45 位与会者,大家看看能识别出哪些专家学者: Aditya Parameswaran Alon Halevy Anastasia Ailamaki Andy Pavlo Arun Kumar Beng Chin OOI Mohan C. Christoph Koch Daniel Abadi Dan Suciu Danica Porobic David DeWitt Donald Kossmann Fatma Ozcan Guoliang Li Gustavo Alonso Ippokratis Pandis Jignesh Patel Joe Hellerstein Johannes Gehrke Julia Stoyanovich Juliana Freire Xin Luna Dong Magdalena Balazinska Mark Hill Matei Zaharia Michael Cafarella Michael J. Franklin Michael Stonebraker Peter Boncz Phil Bernstein Renée J. Miller Samuel Madden Shivakumar Venkataraman Sihem Amer-Yahia Stan Zdonik Stratos Idreos Surajit Chaudhuri Susan Davidson Thomas Neumann Tim Kraska Volker Markl Wang-Chiew Tan Yanlei Diao Yannis Ioannidis。

【2023波士顿会议概要】

本届大会共讨论四个主要议题,分别是:Cloud-native、Al/LLM、Future of Database Engines、Applications, industry, and DB。

9e13bc34819fdaad0959fb87766c9e0f.png

大会上的一个显著热点是:大模型成最热门话题,几乎每个人都在谈论大模型,所以会议的第二天规 定,不许再谈大模型。

在云原生领域多主数据库(Multi-master)仍然是关注的重点,虽然亚马逊实现了 Aurora Multi-master 架构,但是推广和应用似乎并不顺利,仍有大量问题需要克服。

373298fe193094b08ef9df3f43aab75b.png

在 AI/LLM 领域,以下7个热点是大家关注的议题,其中如何实现适度的控制(Control)成为了讨论的关键。

• Control, Compute, Storage

• Retrieval Augmented Generation

• LLM Agent

• NL2SQL

• LLM as Chips/OS

• Data Integration

• Factuality

1f9239ec9418c0abe8ec77e4b45c5725.png

LLM As OS将极大地改变很多领域的工作方式,也将改变数据的应用方式。

a5e21e1eac38d90f87ce222d5c5e4d44.png

大家仍然期待完美的查询优化器(Perfect Query Optimizer),尤其是在传统的数据库中,数据库开发者对使用环境基本一无所知,所以优化器的设计不尽完美。但是在Cloud环境下,从基础设施到应用负载,一切对数据库变得透明,是否能够在云环境下,实现一个完美的优化器,成为了可以考量的挑战。

de2133143e04d5de26cd76b695cf3dfb.png

新硬件的发展为数据库系统设计带来了深远影响,特别是在处理器技术和存储技术方面。过去十几年里,最重要的硬件技术进步包括多处理器(SMP)、多核(MultiCore)、大内存(Big Memory) 和固态硬盘(SSD)。这些硬件技术的发展和进步推动了新式数据库的出现。这些新式数据库不仅对传统关系型数据库进行了大量改进优化(例如分布式、云原生等),而且在新硬件能力的支持下, 如几百核心CPU和超高容量高性能的存储,数据库性能得到了进一步的提升。

b34f03d93b03c7a532693c9f0181c0df.png

【鲲鹏大赛 openGauss 作品】

2023年11月2日,“2023鲲鹏应用创新大赛全国总决赛”在成都落幕。经过6个月的筛选角逐,最终从3大赛事、5大赛道中 评选出13个金奖、16个银奖、19个铜奖。这其中包括6个 openGauss 获奖项目。今年的数据库赛道只有“高校赛”,所以16个项目均来自高校。作为评委,我参与了全部数据库项目的评审,并为同学们的创新与动手能力折服,所以本期报告摘录了其中的一些优秀项目,与读者分享。期待越来越多的学子走上中国数据库的创新之路,也期望越来越多的类似赛事活动, 异彩纷呈,共同推动中国数据库应用创新发展,部分项目我编辑本文件时略加了点评。 

7a71e73632535806e1c87d85dd509a65.png

openGauss 赛道的金奖项目有两个,第一个是来自华中科技大学的“安全的差分隐私医疗诊断辅助查询系统”。这个项目利用了openGauss实时高性能、高可用、高安全特性,结合新颖的差分隐私深度学习方法DPDLDA,提出了创新及实用的安全的差分隐私医疗诊断辅助查询系统。

335408fdd0ab3f1e9eccb73e3798d93b.png

第二个 openGauss 赛道金奖项目是来自西安电子科技大学的“面向openGauss的数据库实践平台”。这个项目的成为,为高校教师和学生提供一个良好的数据库上机实践平台,教师通过该系统可以配置多道、多类型SQL语句评判题目供学生作答,学生在答题的同时也可以通过该系统远程访问、操作 openGauss数据库,满足了数据库课程上机练习评判的需求。项目提出了创新性方法,实现了多种权限控制SQL语句的自动评判,提供自动评判系统,为数据库系统课程的教学和考试提供了极大的便利。

89726801aaa8e1b88be44412df8be716.png

【鲲鹏大赛云和恩墨金奖作品】

在本次大赛中,云和恩墨的 zData X 全栈国产数据库一体机方案,也获得了大赛金奖。

zData X基于鲲鹏底座,融合高性能计算、全闪存分布式存储、RoCE网络、RDMA远程直接存取和数据库管理服务的数据库一体化运行平台,面向当前飞速发展的数字化产业和多元异构数据库系统架构,重点强化两大能力:一是提供全栈可信的、高性能部署环境;二是支持多类型数据库平稳运行

c64e7fbe66b147a4b8c4bae4bf1f9f63.png

【数据库流行度排行】

在2023 年 11 月的中国数据库流行度排行榜上,OceanBase、PolarDB、openGauss、TiDB 名列前茅。

44680a31a4d3bc3a24b7d540445c8956.png

详情请下载参考全文。


云和恩墨大讲堂 | 一个分享交流的地方 | MogDB

长按,识别二维码,加入万人交流社群

请备注:云和恩墨大讲堂

  点个“在看” 

你的喜欢会被看到❤

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值