Chapter 1 信息与信息技术
1.1 信息与信息处理
- 什么是信息?
- 信息是能够用来消除不确定性的东西——香农
- 物质、能量、信息共同构成了人类社会赖以生存和发展的三大资源
- 现在存储信息的主要设备:光盘、U盘、云盘(网络存储工具)、数据库系统
- 大数据时代来临,传统存储管理方式不适用,催生大数据技术。
- 存储容量的单位及换算
- 最小单位:二进制”位“,称为一个比特(1
bit
)。计算机内部所有的东西都是二进制的,010001011 - 8个比特组成一个字节(1
Byte
)1B = 8 bits - 剩下的都以1024(2^10)为进制,即
- 1KB = 1024B
- 1MB = 1024KB
- 1GB = 1024MB
- 1TB = 1024GB
- 1PB = 1024TB
- B–>KB–>MB–>GB–>TB–>PB
- 最小单位:二进制”位“,称为一个比特(1
- 信息的传输
- 信源–>发送器–>信道–>接收器–>信宿
- 信息传输的时候有一套规范的、需要共同遵守的规则很重要
1.2 信息与数字化
-
Why? 将现实世界中的各种信息用数据形式表示出来,方便计算机的存储和处理
-
由于计算机内部采用二进制,把各种信息转化为二进制数,就是信息的数字化。
-
数制及数制转换
- 几进制:逢几进一
- 进位计数制包含:数位、基数和位权
- 十进制(D):日常使用,基数(10),数位(个位十位百位),位权(10^0, 10^1, 10^2, 10^-1…)
- 二进制(B):计算机内部使用,基数(2),数位(第0位,第1位,第2位),位权(2^0, 2^1, 2^2, 2^-1…)
- 十六进制(H):二进制太冗长了,用16进制简化
- 数制转换
- 二进制转换为十进制:按权相乘法,10110B=22D
- 十进制转换为二进制:除二取余法,173D = 10101101B
- 十六进制和二进制的互相转换:用十进制做中介 / 按位对应转换
-
字符编码
- ASCII码,用7位标识(共2^7=128个),8位(1字节)存储,最高位恒为0
0-9,A-Z,a-z
-
汉字编码
- 计算机内部都是用二进制存储的(任何东西)
- 汉字编码包含输入码、内码、字形码
- 输入码:方便汉字输入,各种输入法。(区位码,音码,形码,音形码)
- 内码:计算机内部用来进行汉字存储、处理的编码。内码是唯一的,其中GB2312方案规定用两个字节表示一个汉字。
- 字形码:显示和打印输出汉字用的编码。包含点阵、矢量图和曲线轮廓三种方法。
-
图像编码
- 两种方式:矢量图和位图
- 矢量图:用数学公式计算获得
- 位图:用像素表示
- 位图大小计算:像素个数 X 每像素需要的位数 / 8,单位:B
- 格式:BMP、GIF、TIF、JPG
-
声音编码
- 两个步骤:采样和量化
- 采样:按照一定时间间隔采集声波的振幅
- 量化:转化为二进制序列
- 声音大小计算:采样频率 X 量化位数 X 声道数 / 8,单位:B
- 两个步骤:采样和量化
-
信息的压缩
- 去除数据冗余,更少地占用存储空间和更大地缩短传输时间
- 常用方法:无损压缩和有损压缩
- 无损压缩:压缩后的数据可以还原,数据完全相同
- 有损压缩:压缩过程中会损失一定的信息,压缩后的数据无法还原,会有质量损失,但是不会导致人们的误解。
- 有损压缩格式:MP3(音频)、JPG(图像)、MPEG(视频)
- MPEG压缩:把相邻两幅画面绝大多数的相同像素去除,最大压缩比可达到200:1
1.3 信息技术及其发展
- 四大基本技术
- 感测技术:获取信息的技术
- 通信技术:传递信息的技术
- 计算技术:加工信息的技术
- 控制技术:使用信息做出决策并操作对象实施控制的技术
- 1946年,人类成功研制出了世界上第一台电子计算机ENIAC
1.4 信息安全与社会责任
-
信息安全
- 主要是确保信息的完整性、保密性、可用性、可控性
- 影响信息安全的因素主要有:
- 第一,威胁和攻击
- 第二,知识产权的损害
- 第三,服务质量差
- 第四,误操作
- 信息安全措施,一二三
-
知识产权
- 包含“工业产权”和“版权(著作权)”
- 知识产权战略
-
信息技术的发展是一把双刃剑,产生巨大的促进作用的同时,也不可避免地产生一系列的负面影响
王选:“精密汉字照排系统”,改变了汉字印刷行业的命运