语义信息概述

语义信息概述

什么叫语义信息

  • 无论在图像,文本,语音处理领域等,我们常看到一个词,“语义信息”。(有意义的数据提供的信息

  • 维基百科中的解释: 语义信息(英语:semantic information)在传媒行业指语言文字提供的信息,在计算机行业指有意义的数据提供的信息,在科学哲学领域泛指任何一种有意义的语言文字、符号、数据、公式、理论等提供的信息。语义信息的概念主要是用以区别Shannon信息的

  • 百度百科解释:语义信息是信息的表现形式之一,指能够消除事物不确定性的有一定意义的信息。对信息接受者来说,信息可表现为语法信息语义信息和语用信息三个层次。语义信息可以借助自然语言去领会和解释。只有人类社会的信息才包含语义信息。凡科学信息都属于语义信息。由于个人在知识水平和认识能力方面有差异,因此,对语义信息的理解往往带有较强的主观色彩。不同的人从同一语法信息中所得到的语义信息和语用信息明显不同
    刘建明,王泰玄等.宣传舆论学大辞典:经济日报出版社,1993-03.

  • 语义信息领域比较广泛,我们只关注计算机领域,也就是发现一串数据中蕴含的信息

图像领域

提取语义信息常用来做语义分割
什么是图像中的语义信息?就是处理的单元和周围单元之间关联性的意思。比如上下文信息
(上下文信息:像素与周边像素的某种联系
上下文信息: 上下文信息也可以被叫做上下文特征。指的是图像中的每一个像素点不可能是孤立的,一个像素一定和周围像素是有一定的关系的,大量像素的互相联系才产生了图像中的各种物体,所以上下文特征就指像素以及周边像素的某种联系。 具体到图像语义分割,一般论文会说我们的XXX算法充分结合了上下文信息,意思也就是在判断某一个位置上的像素属于哪种类别的时候,不仅考察到该像素的灰度值,还充分考虑和它临近的像素。 对其再次解释可以理解为图像中该像素点的像素值与它周围的一些像素是具有一定的关系的,也就是说分割领域中是靠上下文信息来联系像素点之间的关系。因为图像是由像素点组成的,当图像上某个特定区域上的像素点产生了联系,这个区域在图像上就突出出来了,这个区域现在就是这个图像上独一为二的区域,也相当于从图像上分割出来了。所以上下文信息其实就是描述像素点之间的关联/关系的。所以我们对每个像素点进行分类之后根据像素点的类别去找这样的上下文信息,而类别信息就是作为图像上的语义信息。 其实感觉这样说还是有点模糊,毕竟个人认为上下文是一个没有公式定义的东西,更多的还是一种理念,像条件随机场,就是一种充分考虑了上下文信息的代表,局部连接的CRF只考虑局部上下文,全连接CRF考虑了全局上下文。

语义分割,也称为像素级分类问题,其输出和输入分辨率相同(如题图中,左边为2048x1024分辨率的Cityscapes街景图像,输入模型,得到右边同样分辨率的语义图)。由此,语义分割具有两大需求,即高分辨率和高层语义,而这两个需求和卷积网络设计是矛盾的。
在这里插入图片描述
图像的语义分为视觉层、对象层和概念层。

视觉层即通常所理解的底层,即颜色、纹理和形状等等,这些特征都被称为底层特征语义;
对象层即中间层,通常包含了属性特征等,就是某一对象在某一时刻的状态;
概念层是高层,是图像表达出的最接近人类理解的东西
通俗点说,比如一张图上有沙子,蓝天,海水等,视觉层是一块块的区分,对象层是沙子、蓝天和海水这些,概念层就是海滩,这是这张图表现出的语义

A theory of Semantic Information

摘要

Abstract

真正对人类有效的信息,必须满足三位一体的,形式上的句法信息、意义上的语义信息,且包含实用的语用信息。香浓信息论是是一种符合句法信息的统计理论,因此,需要尽可能的建立三位一体的信息理论。

简介

Introduction

香农信息论在通信工程的框架下,只需要考虑信号的形式,而与语义和语用信息无关,因此香农信息论确实知识句法信息的统计理论,这不是完整的信息理论。除此之外,相似的研究还包括组合信息理论,算法信息理论。本文将主要探讨信息中的语义及语用信息。

与语义信息相关的基本概念

首先明确,信息的概念和语义的概念。
信息本身是关于一些可以讲述“他是什么的现象”,而知识是关于一些可以讲述“为什么”的本质,而智力是处理一些的策略,可以明确“如何做到这一点”。
在这里插入图片描述

目标信息和本体信息

Object Information / Ontological Information

两个概念相互等同,但是目标信息明显使用更多,被定义为对象所能保持的状态或者状态集合

感知信息和认知论信息

感知信息是一个对象的主题,也被称为认识论信息。被定义为三位一体(语法信息、语义信息、语用信息)。同时这个信息还和认识相关,认识论信息,因为信息不仅仅由对象确定,还决定于理解者的知识和目标

全面信息

句法、语义、实用信息三位一体被称为全面。因此,“感知信息”的概念,或“认识论信息”,声明它有三个组成部分:句法,语义和语用信息
(句法、语义和语用信息)

语法、语义和语用信息之间的关系

具体关系如下图所示,句法信息本质上是具体的,也是可以直接感知的,同样语用信息也是特定并可通过受试者经历得到。但是**,语义信息本质上是抽象的。因此不能通过主体的感觉器官产生和体验**。只能在语法信息和语用信息的基础上,联合映射到语义信息空间中。

语义信息作为感知信息最权威的代表,与语法和语用信息相比。
在这里插入图片描述

知识

  • 文中的知识主要指的是规则。同时使用**“状态规则”的短语来描述知识,恰如上文使用“状态模式”来描 述信息**。

  • 下面分别说明内部链的知识和外部链的知识。(个人理解为获得知识的途径有区别,所以有区分)

  • 通过感知信息进行归纳得到经验知识,通过验证和降维(个人理解为知识的抽象过程),形成直觉知识,具体过程如fig3所示:
    在这里插入图片描述

Internal Chain of Knowledge Ecology

另一方面,通过goal目标的指导下,通过归纳操作,从感知信息指导得到知识,再得到智能,具体过程如下图所示:

在这里插入图片描述

人类智慧

人类智慧为 人类所特有,通过利用他的知识并结合目标,解决环境中面临的问题。 当旧问题得到解决时,将发现,定义和解决的新问题。 通过虚拟这种能力,人类生活条件和人类能力本身的生活水平被持续改善和加强

人类智慧由两个互动部分组成:(1)发现和定义必须解决的问题,以获得更好的生活,被称为隐性智慧,(2)解决由隐含智慧定义的问题的能力,该问题被命名为显性的智慧

人类智能

人类显式的智慧特别被称为人类智能(Human Intelligence),由此Human Intelligence显然是的子集

人工智能

受益于人类的智能(显性智慧),经过人类设计可以实现一定程度上的人为智能行为的机器。这显然依赖知识,因此大量依赖于语义信息

到目前为止,我们可以从上面进行的讨论中得出以下结论:(1)语义信息是将语法和语用信息的关节映射到语义信息和命名的空间的结果。 (2)语义信息是认可/全面信息的合理的代表。 (3)语义信息在知识和智力研究中起着非常重要的作用

语义信息理论的核心

语义信息理论的产生

语义信息本质山是抽象的,因此不能直接通过受试者的感测和体验功能产生。这里提了一个语义信息产生的逻辑图
在这里插入图片描述
本文中这里也提到了一种语义信息表示方法,用N维矢量表示。
y = ( y n ∣ n = 1 , 2 , 3 , ⋯ N ) y = (y_n|n = 1,2,3,\cdots N) y=(ynn=1,2,3,N)
即一个语义信息中包含N个信号元素(single element)。这里y表示逻辑意义,同时逻辑真值使用tn表示,两个值的计算表示如下。
在这里插入图片描述
在这里插入图片描述
因此,原子语义信息及其表示可以为:
( y n , t n ∣ n = 1 , 2 , 3 , ⋯   , N ) (y_n,t_n|n = 1,2,3,\cdots,N) (yn,tnn=1,2,3,,N)
文中提到,语义信息的定量测量,并不像语法信息理论那样重要,所以,放在了附录里。(个人认为,这里的定量表示也很重要啊,不然语义就无法形成标准的应用。)

语义信息的测量

语义信息的主要应用

知识库:基于语义信息的知识组织

知识库(knowledge base)——抽象人类思维,并将大量组成一个大规模的有机知识体系。下图6说明了基于语义信息的知识组织的原则
这里有n个知识,被称为name-1,name-2等等,每一个包含(Form Feature)和(Utility Feature)。个人理解,这里的form feature表示形式上的名称,utility feature表示其使用功能
在这里插入图片描述
文中提出,通过利用基于语义信息的只是原则,可以将大量知识组成大规模和多级知识库****。较低的级别上更加具体,在较高的基础上,更为抽象

基于语义信息的学习和理解

学习,理解,认知和进化是一组相互交互的基本概念,是人类以及机器的最重要的能力。 没有这些能力,人类无法使自己适应环境,并无法尽可能地取得如此巨大的进步

这里作者分了三种认知模式:

  • 接受和记住:婴儿的学习和认知方式。
  • 跟随大众:青少年的学习与认知方式
  • 自主理解:成年人的学习和认知方式
    这三种认知模式没什么说的,作者把第三种自主理解,作为主要的一点说明,并且提出了一个基于语义信息的自主理解学习与认知技术模型。如Fig7所示:
    在这里插入图片描述
    并且提出了一种基于语义信息的归纳认知的方式。
    在这里插入图片描述

基于语义信息的策略创造

作者提出**,归纳型算法适用于从语义信息精炼知识**,而演绎型算法适合从知识、语义信息、以及目标创造解决问题的策略。作者这里提出了一个基于语义信息的解决问题的策略生成的过程。大致过程用下图Fig9表示:
在这里插入图片描述
从图中可以看出,策略创建的任务是根据存储在知识库中的知识所施加的约束,找到从起始状态到最终状态的路径。该策略可以作为一系列规则选择和应用来实现,其中规则被编写为由知识定义的“如果……那么……”。 这就是典型的扣除过程操作。 显然,为智能解决给定问题而创建的策略将是通过执行语义信息、知识和主题目标的某些复杂功能的结果

结论

作者这里提到:了解语义的目的在于,人类需要获得信息从而解决其所面对的问题。为此需要了解信息(语义信息)的含义,一次评估信息的实际价值(语用信息),从而创建解决问题的策略。这个过程是绝对必要的。这就是本文要描述的事情。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

big_matster

您的鼓励,是给予我最大的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值