Semantic Web下的数据集成

        Semantic Web就是语义网,什么是语义网呢?语义网就是现在万维网的一个扩展,在其中信息都给出了明确的定义,能够使人和电脑都理解,从而使他们能够更好地合作。那么,为什么要出现语义网呢,语义网能解决现在万维网遇到的哪些问题呢?

        首先,我们需要了解web上的数据集成的概念:将web上的信息资源进行集成和整合,处理成对我们有用的信息。对于一个给定的资源(可以是人,事,或产品等),我们想要了解所有有关他的讨论。具体地讲,我们就是想要搜集有关于这个资源尽可能多的信息,然后再按需要对这些收集的信息进行删选。可以通过一个智能代理来完成这件事,比如我们可以再浏览器地址栏中输入地址,然后我们的代理就会下载这个页面,并试图从这个页面搜集相关信息。但是,如果这个页面是传统的web文档,我们的代理将不能够搜集很多有用的信息。具体地说,有关这个网页我们代理唯一知道的就是那些HTML结构,比如<p>,<br>,<href>,<table>,<li>等,除了告诉浏览器怎么翻译这个网页,这个HTML结构,不能传达任何有关潜在资源有用的信息。然而,让我们假设这个网页不是传统的web文档,它实际上包含着一些可以被我们的代理收集的表达。即这些表达都会遵循一个相同的结构,它们中的任何一个都是描述了给定资源的一个方面(比如:ns0:ariel     ns0:name  ”simaQiang")。现在,我们不需要考虑,怎样将这些表达加入到网页中,我们的代理又如何搜集这些表达。就让我们假设我们的代理能浏览这些网页,并能够发现这些表达。我们需要注意到,ns0表示一个命名空间,我们可以了解所有的东西,ns0是它的前缀,是从相同的网页中搜集来的。ns:0  ariel 代表了网页中的一个资源,所以刚才的例子可以这样理解:资源ns0:ariel 有个ns:0  name的属性,它的值是simaQiang.

       然后,是否有可能构造出上面所讲的这样一个智能的数据集成的代理呢?为了解决这样一个问题,我们需要了解到底是什么使这个代理成为可能。从最基本的开始,我们的代理毕竟就是在web上运行的一个软件,所以使它称为可能,我们不得不从两方面入手:web和代理。

      在web方面,由于我们的代理可以从不同的web站点中搜集一些表达。因此,每个web站点不得不与传统的形式有所区别,所以需要作出如下改变:

     (1) 我们的代理所搜集到的每个表达(statement)代表了一个知识点,因此,需要有一个模型(现在语义网中描述资源的框架是RDF)来表示这些web上的知识信息。而且,这个知识表示模型需要能被机器容易并很快地处理。

     (2) 这个模型必须被所有的web站点作为一个标准来接受,否则,不同的web站点所包含的表达将不能共享同一个模式。

     (3) 必须要有一种方式能够在web站点中创建这些表达,比如可以人工地增加或自动生成。

     (4) 不同站点的表达不能是完全任意的,比如,他们应该通过一些共同的术语和关系来创建,至少在一个给定的领域。如果需要形容一个人的话,我们有一些共同的术语(现在语义网中描述共同的术语是本体)比如:name,birthday,homepage等。

     (5) 我们还需要有一个方式去定义这些共同的术语和关系,从而使这些术语和关系能够达成一致。不同的web站点,当他们去创建他们的表达时,就会使用这些术语和关系。

     (6)   可能还有更多的东西需要被包括进来。

      在代理方面,为了能够利用这种新型的web,我们的代理也需要进行一些改变:

     (1) 我们的代理能够理解它所收集的每个表达(statement),实现这种方式的一个途径就是理解用来进行创建statement的共同的术语和关系。

     (2)我们的代理还需要能够根据所理解的共同术语和关系进行推理。比如认识到A和B有相同的邮箱地址,应该认识到A和B代表同一个资源。

     (3)我们的代理可以处理一些对它所搜集到的表达所进行的一般查询,毕竟,如果不提供一个查询界面的话,所搜集的表达将对我们没有很大的作用。

     (4)可能还需要更多的东西被包括

       总之,只要我们能够实现上述所说的要求(或许可能更多),语义网下的一个智能的数据集成代理是有可能实现的。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值