仿生:数据库可能的一种进化之道

       “经过数十亿年的进化和自然选择,自然界的生物为人类的创新提供了天然的宝库”

                                     ——摘自路甬祥院士在2003年香山科学会议的发言

早在数十万年前人类诞生开始,人类就开始了向其它物种的学习,学习从大自然中获取灵感。而在现代科技的发展道路上,仿生依然扮演着重要的角色。所谓仿生,是指模仿生物系统的功能和行为,从而建造技术系统的一种科学方法。飞机的设计仿生鸟类的滑翔,雷达的雏形仿生蝙蝠的回声定位系统,六边形建筑材料仿生蜂巢的结构,众多的科技创新都来自大自然的启迪。

       数据库的发展很大程度上是模仿图书馆的管理方式。同样是作为对大量信息的存储和管理,图书馆的分类和索引机制启迪了数据库的搜索优化机制,为数据库的发展提供了很多借鉴。

       但是数据库从文件系统发展到层次结构到网状结构到今天如日中天的关系型数据库,已经在面对不断多样化的应用中暴露出了多方面的缺点:

1,  数据模型中对于构造复杂数据类型来说显得太简单

2,  数据模型中不包含经常使用的语义概念

3,  系统的性能在要求快速计算的各种应用类型(如象计算机辅助设计和程序语言环境中的仿真程序)中是不可接受的

4,  应用程序是以某些数据库语言嵌套进某些程序语言来运行的。数据结构方面数据库语言与编程语言差别很大

5,  传统的数据库系统所支持的事务模型不适合于交互式、协作设计环境下所必须的长(Long-duration)事务。

很多数据库领域的专家都试图在寻找新的数据模式过程中找到突破口,事实上在我看来,除了类似于图书馆、仓库等信息存储管理机制,大自然中还有一种更为奇妙的存储管理海量信息的模型,那就是生物的记忆系统。数学家格里菲斯(J.Griffith)曾经估计,人的一生所存储的信息量相当于《大英百科全书》信息量的500倍,信息论的创始人冯.诺伊曼甚至把人的记忆容量定为2.81020次方bit。不仅如此,人的记忆系统可以存储各种格式的信息:字符,数字,日期,公式,旋律,图像甚至情感,如果不是因为人的遗忘(考虑到人的记忆可能在某一时刻突然唤醒,可以将失忆理解为记录仍然留存,但是通向这条记录的直接索引丢失了),人的记忆系统绝对是一个超级强大的数据库系统。

       撇开人对记忆的处理中涉及人工智能的部分,单从数据库的角度看人的记忆系统,这首先应该是一个面向对象的“数据库”。因为通过从现实世界中客观存在的事物(即对象)出发来存储和管理信息,更符合人类的自然思维,对于复杂数据的构造,也不需要施加更多的拆分逻辑,直接就支持字符、数字、日期、公式、旋律、图像、视频等多种形式的信息存储。此外,应该有适量的语义信息,否则信息无法被组合成一条连续的记忆。

       同时,人的记忆也是一个面向主题的“数据仓库”。在人的进化过程中,思维系统与记忆系统分离,根据不同的查询,从记忆系统中提取信息,返回给思维系统进行加工,然后得到诸如什么时候适合哪些人去哪些地方玩,哪些工作和哪些人配合可以得到最佳产出等结果集。这一过程,非常类似于当前流行的联机分析处理(OLAP)概念。不同于OLAP中数据仓库往往和事物数据库需要互相冗余,人脑的数据似乎只有一个备份,但仍然可以满足一边进行更新,一边进行快速在线分析的功能。排除人脑超级强大的分析和计算能力,人的记忆是如何对事务性操作和分析性操作进行建模,应该是值得未来的数据库发展进行借鉴的。

       当然,现在的演绎数据库和归纳数据库本身就是将人的演绎和归纳能力类比到数据库中的一个产物,如果可以从模型上接近生物记忆系统,那么对于演绎数据库和归纳数据库的实现来说,相对于现在就要容易得多了。

       就目前来说,数据库仿生人的记忆系统,更多地是从功能层面,而不是从模型层面,其深层次的原因恐怕还是源于人脑极其复杂的结构。就目前的科学成果而言,动物的记忆力,与存在于脑中的核糖核酸、乙酸乙脂等物质有关。这种核糖核酸可以抽取注射,也可以转移。比如大白鼠受电击时产生的恐怖记忆,可以被提取注射入另一只大白鼠身上,它会不经电击就产生那种恐怖的情绪,说明前者的记忆力被后者继承了。这非常相似于数据库级别的数据传输。但是这些具有承载着记忆的蛋白质分子是如何组织,如何传输,如何继承的,对于现在的人类,仍然保留着过多的神秘。

       数据库仿生生物记忆系统,也许只是一种奇思怪想,但究竟是否会成为未来数据库发展进化的一个方向,恐怕还需要数据库领域,人工智能领域和生物领域的专家来为我们解开。但无论如何,数据库的发展都需要能够融合和借鉴其它学科的模型和机制,不仅仅是生物和人工智能。

阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭