语义网系统纵论(下)

转载 2007年09月13日 22:31:00
语义网系统纵论(下)
[日期:2007-9-12] 来源:  作者: [字体: ]
引子:小儿科样的Web3.0,跟这里所要阐述的语用网相比,我以为已经足够简单了。微软很早就联系了我,说他们被google的成功气炸了肺,发誓定要搞个盖了帽的东西出来不可。但我却不能理解微软为何迟迟不把这个玩意儿上线,害得我不得不详细写出来,好让大家理解完整了。看了这里,我们大家就都可以成为计算机专家、特别是网络专家了。写全面一点,免得误解。
摘要:完整给出了Web3.0的问题、系统实现与模型分析
标题:Web3.0系统—用P2P网络实现Web语义搜索的知识共享
 
赵维谈什么是Web3.0之一—Web3.0问题
赵维谈什么是Web3.0之二—我的系统
赵维谈什么是Web3.0之三—知识共享系统解析
赵维谈什么是Web3.0之四—WebOS系统展:分析WebOS系统问题及由来
 赵维谈什么是Web3.0之五—Web系统发展总结
  
(以上请参见上一篇--【总结篇Web3.0系统纵论(上--818日更紧接着部分为以下【总结篇】Web3.0系统纵论(下)的内容)
 
赵维谈什么是Web3.0之六—知识共享系统之深度解析
深度解析《Web3.0—P2P网络实现Web语义搜索的知识共享系统设计》
 
          在上面的“Web3.0之五里已经说过:社会化网络包括实现信息联通的互联网、实现资源共享的万维网(Web)、实现知识共享的语义网(Web3.0),以及实现计算协作的语用网等界线分明、功能依次递进的4个层次  。那么在各个层次里的技术系统又是如何发展的,并且是什么样的规律在技术发展的现象背后起着决定性的作用的呢?该问题的理解需要非常的智慧,以下我试着讲解。
   
        实现信息联通的互联网已经深入人心了,并且已经被确认了,社会信息网络正3网合一到互联网上来了,自不必多言。下面分别从Web、语义网和语用网3方面来谈。
    
Web存在与发展的理由    
         
    在实现资源共享的Web层面,有早期局域网络系统里的文件服务器和广域网络(即互联网)里的ftp服务器,人们完全没有看清Web服务器的必要性。这就是Web发明人当年推广Web系统技术不起来的根本原因。后来是在网景公司获得成功,以及IBM等大型机构的参与下才逐渐把Web发展成为社会信息基础设施的。可惜人们似乎并没有分析这里的深层次原因,来吸取经验教训,以避免类似的先进技术不被投资与科研界所认同的尴尬再次发生。这里试图做一弥补。
   
    文件服务器是局域的,ftp服务器是广域的,它们都是孤立的,相互没有联系的,因而是无结构的。而Web网络却是相互联系的,把整个Web资源相互联系为一个整体。该整体就是Web的系统结构。请参见上面系统分析里的“什么是Web”以及“Web系统结构”的有关章节。
   
    普遍联系的特性是客观世界的本源特征之一。Web恰是揭示了这一世界本源,因而才得以普及为社会信息基础设施的。而且Web之后将不会再有其它什么系统来更好地实现资源共享了。也就是说在资源共享网络层里,Web就是最佳答案了。所发展的也是Web自身的发展,而不能取代和推翻。如Web取代了ftp服务器,语义网实现的知识共享将推翻如Google和百度的Web关键字索引系统。
    
语义网存在与发展的理由
     
    在Web广为社会所接受以后,其发明人又开始搞了语义网,虽然推广了许多年,但人们仍然不理解。是因为Web发明人并没有认识清楚语义网的本质和关键,所以他阐述得不够明晰,因而人们就无法实现了。
   
    在Web发明人,即语义网概念提出人的眼里,Web之后的一切都是语义网了。其实这是错误的,不正确的。早在2002年就有人指出Web之后必然存在着语用网系统(The Pragmatic Web--MAY • JUNE 2002 http://computer.org/internet/ 1089-7801/02/$17.00 ©2002 IEEE IEEE INTERNET COMPUTING)。而在2007年更有人指出来语义网并没有提出人所阐述的那么先进和智能,而仅仅就是Web3.0(Embracing “Web 3.0”--Published by the IEEE Computer Society1089-7801/07/$25.00 © 2007 IEEE IEEE INTERNET COMPUTING)。这里我更给出了我所发明的这个知识共享系统,并且明确指出来:语义网层次里,这个知识共享系统就是最终系统了。因为它揭示了主观世界的普遍联系特性,该特性也是主观世界的本源特征之一。
   
    语义网的基本实现就是RSS、OPML和这里将给出的实现知识共享的KML(Knowledge Markup Language,知识标记语言)。其中RSS聚合Web资源,OPML聚合RSS,而KML是在Web客户端世界里组建的P2P网络里聚合OPML。KPL将演进为“知识本体库”。
   
    从关注Web资源的社会学属性,而发展出来的知识共享系统,不久将成长为社会知识的基础设施,并将以“知识本体”的身份或面貌发展成为实现社会知识计算的语用网系统的支撑。
       
语用网存在与发展的理由
          
    语义网知识本体是Web里网页资源的聚合而来。当Web资源是程序模块时,软件模块聚合为更大的模块甚至系统。模块聚合需要明确定义模块间的关系。这里的模块就是对象,或者类。模块间的关系就是消息,实现对象间通信的消息。
   
    Web资源是软件时,称该软件为Web服务,简称服务。这个领域的研究通常把这里的模块聚合叫做服务组合,即SOA。语用网就是具体实现SOA的技术系统。
   
    但语用网与SOA仍然有根本区别:SOA的软件部署于Web服务器端,服务组合发展在Web服务器端之间;而语用网的计算模块部署于Web客户端,计算协作发展在Web客户机端之间,Web服务器里仅仅存储了计算模块软件的执行代码系统。
   
    理解语用网确实有点困难。这个理解困难主要体现在以下3点:1)要理解软件系统都遵循图灵机模型。任何软件系统,小至一个计算模块,大至一个计算应用,都是一个图灵机系统。2)图灵机系统的偶模型叫Petri网。3)Petri网模型的实现技术就是语用网系统了。以下试着分别阐述。
             
软件系统实现图灵机模型    
                           
    计算是人类认识与实践活动的基础。所有数学系统里,自然数都属于公理性认识。加减乘除四则运算,至少加法和乘法运算,也是公理范畴。当我们要求加法与减法互逆的时候,运算的数域将扩大到了整数范畴。同样乘法与除法互逆的要求将扩大数域到了有理数。而继续引入的其它运算,如指数对数三角等,又在逆运算的要求下扩大数域至实数范畴了。在更大的数域里增加更多的运算子,是人类数学认识的一般发展过程。
   
    运算的通用模型为(P,D,I,O)四元组。其中P是运算符或者叫做操作符,D是被运算数或者叫被操作数,I是运算数或者叫操作数,O是运算结果或者操作结果。一般计算任务,通常不能由一次运算获得,而需多次连续运算。称该多次连续运算过程为该计算任务的图灵机进程。因此图灵机进程就是我们解决数学应用的计算过程。一个完整的计算过程就是一个图灵机系统。称实现图灵机系统(具有相同的条件I和相同的结果O)的所有图灵机进程等价。因此图灵机系统又称特殊图灵机模型。而研究所有图灵机进程的一般性规律的就属于通用图灵机模型了,研究通用图灵机模型将导出著名的算法实践。因此算法是计算机工程里最重要的部分了,算法的实现就是软件系统。
   
    特殊图灵机模型定义为(I,O;P,D),即在已知操作数(I)和预期操作结果(O)的情况下,如何用连续的操作符与被操作数组合(P,D)来完成计算任务。称这个连续的(P,D)组合--还是(P,D)组合--为该计算的图灵机进程。通用图灵机研究图灵机进程的一般性规律。因此算法必需包含2个部分:记录运算子的操作符号系统,记录被运算数的操作数据系统。操作系统就是合理安排该操作符号与操作数据的计算机系统。
   
    算法都体现为一个软件,小至一个具体的计算模块,大至控制许多计算模块组合规则的应用系统。程序实现算法,图灵机回答算法的正确性和有效性问题。其中算法有效性又叫算法复杂度。如今居然有软件人员不知道算法,更不知有图灵机的,实在令人汗颜!
             
图灵机模型与Petri网模型对偶   
              
     一个图灵机系统定义为(I,O;P,D),即在已知操作数(I)和预期操作结果(O)的情况下,如何用图灵机系统来实现计算任务。一个Petri网系统定义为(P,D;I,O),即在已知图灵机系统的情况下,如何用联系图灵机系统间的输入输出(I/O)消息来实现图灵机系统的组合,以实现动态系统的计算模拟--称该计算模拟为系统仿真。并称这个沟通图灵机系统的消息序列为该计算的Petri网进程。我称这里实现算法组合的计算为Petri计算。相对应的,我称实现算法的计算为图灵计算。
  
    当我们把图灵机模型(I,O;P,D),与Petri网模型(P,D;I,O),放一起对比研究的时候,我们发现它俩具有特别的关系:图灵机模型的问题域--(I,O)组合--恰是Petri网模型的解域,而图灵机模型的解域--(P,D)组合--恰又是Petri网模型的问题域。反之亦然。
  
    在数学里,我们称这种问题域与解域互换的一对数学模型为对偶模型。对偶模型间存在对偶关系,即任一系统里的命题的偶命题就是其对偶系统里的命题。这是我们研究对偶模型的价值所在,如此就可以迅速地扩展人类的认识范围。
                  
知识计算实现Petri网模型   
                   
     如上分析所知,Petri网系统解决软件系统的组合、即图灵计算协作问题。我称实现图灵计算协作的Petri计算为知识计算。不同于以往的计算就是软件里的图灵计算,以后的计算不仅包括以前的图灵计算,更有这里的Petri计算了,因此我们要特别指出不同的计算模型。如不指明就是缺省的Petri计算了,因为这里研究的就是Petri计算。
  
    知识计算是以软件模块为基础,统一解决模块复用问题。如何实现知识计算呢?首先是抽象软件模块,再定义模块间的消息。当计算机系统里的所有软件模块以及沟通模块间联系的消息,统统都定义完整了的话,该系统将被唯一确定。
  
    在UEFI里,软件模块被注册于handle数据库里。知识计算就是基于该handle数据库之上通过定义消息序列来构造计算机应用系统的。称一个Petri网计算机应用系统里的所有消息所组成的偏序序列为Petri计算的进程。网论里,称Petri网系统为特殊网论。而通用网论研究所有网系统的Petri计算进程的规律性,从而导出语用网和知识计算,如同通用图灵机研究导出算法和程序设计一样。图灵机回答算法的正确性和复杂度,Petri网回答了知识计算的正确性和不变量。其中不变量回答了知识计算系统的有效性、即效率问题。
       
软件计算发展为知识计算   
         
    软件工程技术当前已经发展到了面向对象(OO)这里了。在OO技术里,一切都是对象,对象就是一个图灵机模型的实现。OO技术(如java)里最重要的发展是实现了接口(interface)与实现(implementation)相分离。但这个分离不够彻底,系统访问模块的正常方式是接口,但也可以直接访问模块本身。而且在程序设计中,这种直接访问方式使用的似乎更多更广。人们只在特别需要标准化的地方才设计出接口来。
   
   在UEFI里,已经不在直接访问模块本身了。所有注册进handle数据库的模块都被抽象为接口。UEFI里的接口叫协议(Protocol),是模块间的相互访问标准。在OO里我们知道,一个模块可以实现多个不同的接口,同样,一个接口可以被多个不同的模块分别实现。 接口只有被实现后才能访问,访问的是模块,而不是接口本身。接口本身不能被访问。
   
    如此分析,我们就知道了:知识计算只不过是软件工程技术自身发展的一个必然;而在技术发展背后起决定作用的却是计算系统基础理论的质变过程。
  
我们应该如何学习?
  
    这个话题我说了很多遍了。在一个注重原始创新的社会里,我们一定要学习原文。所谓学习原文,指的不是学习英文,我指的是学习发明人的原始著作,比如学习图灵机就只能阅读图灵自己的著作,学习Petri网也一定要阅读Petri本人的原著!他人的文章一般不可阅读,至多只能当理解发明人原著有困惑时的参考。这个参考价值实在是微乎其微:一般来讲,没有人比发明人自己对他的东西更理解的了,否则就是别人的发明了,至少也是别人更进一步的补充发明了。
   
    用这个阅读原创发明的观点和方法来看,可以供我们阅读和学习的东西其实真的很少。一般来讲,当今社会发达的时代,发明总是相当困难的。一个人一生也不会有太多,一篇,甚至有一句话传世下来,就应当是很了不起的事情了。那些所谓著作等身的达人们,通常写的都是小说或者以写小说的方式来做研究而已,如徐志伟老师的《电脑启示录》。
 
    跟发明家学习原始创新,而跟小说家学习就只能写出小说来了。这是我国计算机科研领域内的当前写照!
   
赵维谈什么是Web3.0之七—基本概念补充
   
    这个部分主要阐释一些特别重要又很基础的基本概念和观点。如计算机科学的研究领域,以及什么是计算语言,以及语法的研究对象。
         
什么是语义学和语用学?
   
    语义与语用都是语法学里的专有术语。所谓语言就是一个符号系统,语法研究符号系统规律或规则。语言有自然语言与理论语言之分。一般而言,自然语言就是人类语言;理论语言从数学语言到专业词汇等,主要是人们设计出来用于表达和描述某一模型或系统规则与行为的。自然语言语法研究自然语言规律,理论语言语法定义理论语言规则。人们是从自然语言规律中认识语法,并在理论语言规则中实践应用语法的。
   
    哲学研究世界本源。人类一切认识,特别是具体领域科学,都起源于哲学。因此语法学的起源就是语言哲学了,语义学和语用学都是语言哲学的研究领域或分支。特别是语用学几乎还没有被从哲学领域里分离出来。语义学和语用学定义不同理论语言规则。 
     
    语义学规则形如英语(或者程序设计语言),有26个字母的基本语言元素(或者确定数量的程序设计语言关键字与保留字),字母有限排列为单词(或者关键字有限排列为程序语句),单词有限排列为语句(或者程序语句有限排列为程序模块),语句有限排列为文章(程序模块有限排列为程序系统)。
    
    语用学规则形如汉语(或者知识计算语言),有理论无穷实则有限多个汉字(或者理论无穷实则有限多个语用字),组词(语用组词),造句(语用造句),谋篇(语用谋篇)。
 
    人们特别称被物理实现了以后的理论语言为计算语言。因此语义学语言就是算法理论与程序设计语言,而语用学就是我的研究并在这里指出其实现方法论的。
 
语义学概念与语义网项目间的关系
 
    上面所说明的语义学是语法学研究的分支,目的是给出语义学理论语言来。而语义网项目是Web发明人提出来的Web系统技术的一个发展方向或者可能,但多年没有实现。在语法学里很早就有语义学研究了,早期的人们认为语法里面只有语义学一个理论。直到1938年前后人们才认为语义学不能阐述全部语法现象,因而才杜撰并引入语用学概念来。但语用学的研究却一直萌芽中,没有深入。上面给出的只是我个人的研究。语义网项目的发起人所说的语义就是早期语义,即没有分化出语用学的语义概念。因此我的“语用网与知识计算”研究实际上是探索了语义网项目的一条切实可行的实现道路。
    语义网里的重要技术概念RDF、OWL等,被实践技术RSS、OPML以及这里的KML等所覆盖和实现。
 
什么是网格(Grid)计算?
 
    早年由Ian Foster发起的网格计算项目,曾以其华丽的名头吸引了国内众多的跟风者。但人们始终回答不了“什么是网格”,以及“网格如何解决问题”等基本概念,从而导致该项目早已成为了镜中花水中月。事实上Foster设想网格计算项目也是希望解决计算协作问题的,因为计算机工程里只是”计算协作问题“才是实现图灵机系统以后的最根本问题。
 
    该境况在语义网格等其它众多探索性项目里一样存在着。这里就不一一而足了。
       
什么是计算机科学的研究对象?
   
    自然科学都是自己明确的研究对象,如物理研究客观世界的组织结构规律,化学研究物质的分子学规律,历史研究人类过去经历,地理研究地球发展规律。那么,计算机科学研究的对象是什么呢?
    
    有人说是计算机硬件系统,即逻辑与数字的电子电路学。这个认识显然是错误的,硬件部分只是计算机系统的物理实现,而不是计算机的本质。
   
    还有人说计算机是研究图灵机及其实现的科学,这个理解在过去算是基本正确。图灵机是一个数学的理论模型,理论模型表达为理论语言系统,人们称表达图灵机的理论语言为算法。因此计算机的研究对象是算法及其物理实现。
   
    计算机研究图灵机语言与实现,图灵机只是一个数学模型。那么其它数学模型是否也可以是计算机所研究的对象呢?答案是肯定的,只是其语言与实现技术没有被发明出来,也就缺乏实用价值,因而缺乏研究罢了。Petri网便是另一个研究计算理论的数学模型。由于Petri网与图灵机对偶,而图灵机是已经实现了的计算模型,所以我们可以基于图灵机系统之上实现Petri网模型。Petri说实现Petri网模型的理论语言就是语用学。与算法相对应,我称语用学研究内容为知识。因此我的研究实际上是探索了一条以图灵机系统为基础实现再一个计算模型的方法和道路。该道路是比软件工程更为抽象的一门语言和方法论。
 
    就是因为人们对计算机科学研究对象的模糊性认识,导致如今人们虽然须臾都离不开计算机,但还存在有怀疑计算机是否能够算作一门科学的声音。
 

    计算机科学的本质是研究人类意识的理论化及其物理实现的系统技术,也即吴文俊所谓的“脑力劳动机械化”

  
“语用网与知识计算”属于计算机的哪个研究领域?   
    
    前面分析所知,计算机科学不仅具有数学属性,更具有哲学属性。人工智能研究起源了计算机科学的各个领域,很有着“计算机系统哲学”的味道。因此语用网首先属于人工智能范畴。
 
    语用网落在Web发明人所提出的语义网领域。可以这么说:语用网项目研究并实现了Web发明人所提出来的语义网项目的全部设想,语用网项目给出了“语义网项目设想”的以Petri网论作为系统理论依据、语用网作为物理实现方法与知识计算作为计算发展道路等一揽子计划与方案。
  
什么是KML语言?
 
    Web资源聚合语言已经包括RSS聚合Web资源、OPML聚合RSS,由于RSS和OPML里所包含的语义学特性不足,因此我发明了这个知识共享系统。按此专利可以直接导出聚合OPML的技术标准,该标准就是KML,知识标记语言。
  
      实现Web资源聚合的语义网,发展到KML时就完整了。KML将直接演化出“知识本体”来,因此也叫KOL,知识本体语言。
      
总结
   
   如上分析,Web网络的4层结构:互联网、Web资源网、语义分配网和语用协作网。语义分配网指语义网实现Web资源分配、计算分工;语用协作网指语用网解决基于UEFI的计算协作问题。两者都属于社会学分工与协作的范畴,因此我称它们为社会计算。现在来理解语用网与知识计算系统,是否会更加容易些呢?

 

相关文章推荐

Java中间件:淘宝网系统高性能利器

【TechTarget中国原创】淘宝网是亚太最大的网络零售商圈,其知名度毋庸置疑,吸引着越来越多的消费者从街头移步这里,成为其忠实粉丝。如此多的用户和交易量,也意味着海量的信息处理,其背后的IT架构的...

关于毕业设计——面向运动的无线体域网系统设计的构想

无线体域网(WBAN)由一套小型轻便的微型传感器组成,可穿戴或植入人体,这些传感器具有收集人体生理信号的功能,通过无线网络把所手机的信号传送给监测系统。监测系统通过对所收集到的信号进行分析和处理!对处...

IOS开发之通过官网系统学习UIKit

IOS开发之通过官网系统学习UIKit                 相信大家从事移动端开发,会买大量的资料去学习,其实我也是这样的,不光花了钱去买书籍  还花了一笔钱去参加培训之类的。随着自己...

一淘网系统架构

一淘的系统架构       一淘有三个数据来源:互联网、外部合作方和淘宝主站。其中,互联网数据通过crawl的方式获得,而后两者则通过feed的方式提供。           抓取系统的功能包括...

开心网系统架构分析

开心网是一个人气蛮高的sns社区,虽然在走下坡路了,在国内依然算是顶尖了,今天我们就来分析一下开心网的设计架构是怎样的。因为手头没有这方面的资料,也没有和开心网的程序员有过什么交流,所以今天所写的一切...
  • aufe163
  • aufe163
  • 2011年06月14日 22:19
  • 483

基于语义网的自动问答系统实现

文章同步个人独立博客 1.本体的创建 本体的作用是描述概念与概念之间的关系。它给出了构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义。 利用本体,我们可...

免费办公网系统

  • 2014年05月24日 23:30
  • 22.11MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:语义网系统纵论(下)
举报原因:
原因补充:

(最多只允许输入30个字)