语义网
简单介绍
将检索到的信息解释含义和提取有用的信息,要求内容是可以被机器所理解的。一种方法就是用一种新的方法描述信息,也就是语义网。
意义
知识管理:根据含义用概念空间组织知识; 跨文档的问答功能;规定信息的权限。
电子商务:提取价格和补充信息; 企业间信息交换。xml必须要求双方对使用的词汇表达成了共识。
个人代理: 机械公敌中的个人代理真的能实现了。
技术
源数据:类似于xml
本体:某个概念相关的内容,多在一个domain中,由多个term(domain中的类)。 包括term, property,值约束, 不相交描述,对象间逻辑关系的规定
OWL是对RDF进一步扩展, 通过namespace引入的rdfs,我觉得应该是 RDF Schema的定义
逻辑:需要被机器处理,则需要用网络语言表示逻辑知识和逻辑证明,使用工具是OWL 或者DAML+OIL
代理:自主和自动运作的软件。接收用户需求,在网上找到相关信息,和其他代理交流,根据用户需求和偏好做出选择,将答案交给用户,主要作用是收集信息,提供备选方案。用到的技术:使用元数据收集信息;使用本体解释信息,和其他代理交流;用逻辑处理推导结论
和人工智能的对比:人工智能是建立类人的智能,而语义网只是协作人类处理网上事物,要求比人工智能低
相互关系:XML——》RDF——》OWL——》逻辑——》证明——》信任
XML相关
html不包含结构信息,即文档成分及其相互关系的信息,XML使用标签定义成分,使用嵌套定义相互关系
xml 还可定义约束,如年必须大于0
要想在万维网上交流,大家必须说同样的话,所以各种标准组织基于xml为各个领域定义了各种专用的xml词汇,rdf就是其中一种。
验证方式
描述xml结构有DTD和xml Schema 两种方式
DTD
定于 element及关系;property(名称,类型和值);支持递归定义,正在慢慢淡出;
Schema
好处:
基于xml自身语法
提供了schma重用和简化的可能:扩展已有模式建立新模式
提供一套数据类型集
组成:
元素类型 <elementname="" /> 定义 type, name,minOccurs, maxOccurs
属性类