课程内容梳理
本章对信息论做了简单介绍,同时对计算机与信息的关系进行了探讨
信息的定义
- 维纳:信息不是物质也不是能量
- 朗高和阿希贝:从差异定义信息
- 钟义信:在本体论和认识论层次上定义信息
本体论层次:信息是事物运动的状态及其变化方式的自我表述
认识论层次:信息是指认识主体所感知活所表述的事物运动的状态和方式,可分为
1.语法信息
2.语义信息
3.语用信息
4.先验信息
5.实得信息
6.实在信息 - 香农:假定事物状态可以用一个经典的集合论为基础的概率模型来描述,则信息就是用来消除不确定性的东西,活信息是事物运动状态或存在方式的不确定性描述
缺点没有考虑信息接收者的主观特性和主观意义,不顾信息的具体意义、具体用途、重要程度、和可能引起的后果等因素 - 属加种差的定义:被定义概念(种概念)=邻近的属概念+种差
以“计算机”为例,首先计算机属于机器,“机器”就是它的属概念,但与其他邻近“属概念”(如冰箱、洗衣机)不同的是,它可以用于高速计算,由电子原件构成,所以计算机的定义是“一种用于高速计算的电子计算机器”
总之一切客观存在的都是信息。
信息的种类
- 按照产生信息物体的性质:自然信息、生物信息、机器信息、社会信息等
- 按照人类活动区域:科技信息、经济信息、政治信息、军事信息、文化信息等
- 按照信息依附的载体:文献信息、口头信息、电子信息、生物信息等
- 按照携带信息的信号性质:连续信息、半连续信息和离散信息
- 按照信息所起的作用:无用信息、有用信息和干扰信息
信息的度量
由于不确定度的大小是可以度量的,因此,信息可以度量。
信息论基本假设:
- 信息是可以用一组符号来编码的
- 信息的产生和传输是可以用概率论和随机过程来描述的
- 从概率论的角度来看,同样的信息包含同样的信息量
自信息量是指一个事件本身包含的信息量,它是由事件的不确定性所决定的。
1948年,香农提出“信息熵”:信息中排除了多余重复信息后的平均信息量。
- 最小值:某个事件概率为1,其余为0
- 最大值:所有符号出现概率相等
计算机信息处理
1.位模式的信息表示
-
文本的表示:英文一般采用ASCII编码、Unicode编码等,中文采用与前者兼容的GB2312—1980编码。
二进制是比ASCII编码存储数值更有效的方式,可分为无符号数和有符号数两类。
有符号数根据编码不同可分为原码、反码和补码- 原码中0有两种形式
- 反码中正数与原码相同,附属将原码数值部分按位取反
- 补码:自低位向高位,尾数的第一个“1”及其右部的“0”保持不变,左部各位取反,符号位不变。在补码中,0的形式唯一
-
音频的表示:音频一般用一种模拟的连续波形表示,即声波,数字化处理过程包括采样、量化、编码三个步骤。
-
图像的表示:计算机处理图像有两种方式:矢量图和位图
- 位图所需存储容量较大,缩放和旋转时容易造成图像失真
- 矢量图不会再成失真,但难以表现色彩层次丰富的逼真图像效果
-
视频的表示:视频按位模式存储,通常需要一些特殊技术来压缩存储视频文件
2.计算机信息处理过程
学后体会
信息是一个高度抽象的概念,从古到今很多科学家从不同的角度对它进行了定义,各有优劣,因此要综合起来看待信息这个概念。信息的大小可以由其不确定性来度量,而信息熵从平均意义上来对不确定性进行度量,并用比特这个单位表示,从而将信息大小量化,便于处理。不同形态的的信息都可以通过转化成位模式在计算机内存入和输出,从而通过计算机完成信息的处理和转化。