本系列为高中信息技术笔记,有需要的小伙伴可以持续关注哦
文章格式介绍
-
此类注释框为重点内容强调和我对于重要内容的理解
-
重难点采用加粗标出
-
删除线为玩笑内容或错误内容 -
此类文字表示常见或易错的问题或代码语句
当内容多行时,也会用代码块
-
斜体样式表示专用名词
-
所有的数学公式、符号等,均采用 L a T e X ;数字等均采用此格式 所有的数学公式、符号等,均采用LaTeX;数字等均采用此格式 所有的数学公式、符号等,均采用LaTeX;数字等均采用此格式
本章为普通高中教科书信息技术必修一数据与计算的第一章
1.1 感知数据
- 数据在当今社会体现出前所未有的价值
- 计算机已成为数据处理的主要工具
数据处理的工具不只有计算机
- 人们在利用数据的同时,自身的行为也在产生数据
人既是数据的使用者,也是数据的来源之一
1.2 数据、信息与知识
- 数据是对客观事物的符号表示(数据的定义)
- 单纯的数据是没有意义的,因为数据的表现形式还不能完全表达其内容,经过解释,数据才变得有意义,数据和关于数据的解释是密不可分的
数据是信息的载体,文字、符号、图片、音频、视频都是数据的表现形式
数据≠信息
Q:书本是信息吗?
A:不是,书本上的文字是数据,数据经过解释才是信息。文字只是数据的表现形式,是信息的载体,书本是文字的载体
-
信息论的奠基者是香农(这条在高二尚不重要,但在信息学奥赛中属于信息学史考察范围,高考可能会考)
-
信息的特征:
- 载体依附性:信息无法独立存在,必须依附于载体,同一信息可以依附于不同载体
无线传输时,信息的载体同样存在,是电磁波
- 时效性:信息反映事物某一时间的状态,会随着时间的推移而变化
过了这一时间后,重要性有所降低,但是仍然存在价值
- 共享性:信息可以共享,同一种信息可以同时被不同的接收者获取,人们可以重复利用信息,信息不会因为别人的获取而发生损耗
- 可加工处理性、真伪性:信息有真伪,可以被人工处理
- 价值性:信息具有价值;显性价值:信息本身体现的价值;隐性价值:通过信息掌握知识、技能;信息的价值是相对的,对于不同的人,不同的时间,价值可能会有所不同(但是价值不会失去)
隐形价值是指经过对信息进行分析处理,从而学习并加以利用
- 数据—被解释后—>信息—被学习后—>知识——>智慧
数据本身没有价值没有意义
信息有价值有意义
知识是指人所拥有的、学会的、理解的信息
智慧是指人应用知识、预测未来、处理与知识相关问题的能力
1.3 数据采集与编码
- 现代获取数据的方式:传感器、网络爬虫、互联网…
- 模拟信号以连续变化的物理量存在
- 数字信号在取值上是离散的、不连续的信号
- 将模拟信号转换成数字信号的过程成为数字化,也叫模数转换
- 数字化是信息社会的技术基础
- 模拟信号转换成数字信号需要经过:采样、量化、编码的过程
- 每秒的采样样本数叫做采样频率,单位为赫兹
采样频率决定了采样点的个数(采样频率也会影响保真度)
量化值决定精度、保真度
进制
电脑版可以直接点击下方视频放大观看
-
进位计数制:
将数字符号按序排列成数位,并遵照某种由低位到高位的进位方式计数表示数值的方法,称作进位计数制(非常文绉绉的,说实话是百度上抄来的,没啥大用,了解一下就行) -
十进制D:
十进制计数制由 0 、 1 、 2 、 3 、 4 、 5 、 6 、 7 、 8 、 9 0、 1、 2、 3、 4、 5、6、 7、 8、 9 0、1、2、3、4、5、6、7、8、9共 10 10 10个数字符号组成
相同数字符号在不同的数位上表示不同的数值
每个数位计满十就向高位进一,即逢十进一 -
二进制B(必会):
二进制计数制由 0 0 0和 1 1 1共 2 2 2个数字组成
每个数位计满二就向高位进一,即逢二进一 -
八进制O(这个不太常考,了解一下就行):
八进制计数制由 0 、 1 、 2 、 3 、 4 、 5 、 6 、 7 0、 1、 2、3、 4、 5、 6、 7 0、1、2、3、4、5、6、7共 8 8 8个数字组成
每个数位计满八就向高位进一,即逢八进一 -
十六进制H:
十六进制数由 0 、 1 、 2 、 3 、 4 、 5 、 6 、 7 、 8 、 9 、 A 、 B 、 C 、 D 、 E 、 F 0、 1、 2、 3、 4、 5、 6、 7、 8、 9、 A、 B、 C、 D、 E、F 0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F共十六个字符组成
逢十六进一
不同的是用 A 、 B 、 C 、 D 、 E 、 F A、 B、 C、D、 E、F A、B、C、D、E、F分别表示 10 、 11 、 12 、 13 、 14 、 15 10、 11、 12、 13、 14、15 10、11、12、13、14、15六个数字 -
十进制转换成 N N N进制——短除法
-
N N N进制转换成十进制——加权相加法
以上两个方法由于文字描述不够清晰,请观看视频学习
编码
- 编码是信息按照编码规则,从一种形式转换为另一形式,解码是编码的逆过程
Q:手机扫描二维码识别信息是编码过程吗?
A:不是,生成二维码是编码过程,扫描二维码是解析(解码)过程
- 无论什么形式的数据,最终存在计算机里是二进制数字
数据存储容量单位
- “ 0 0 0/ 1 1 1”的二进制数的位数就是几位
- “位”叫做比特(bit)
- 比特是最小的存储单位
- 8位=1字节(Byte) Byte往往会缩写成B
- 字节是最基本的存储单位
1KB=1024B
1MB=1024KB
1GB=1024MB
1TB=1024GB
1PB=1024TB
-
单位转换间均是 2 10 2^{10} 210
-
汉字编码:
1 1 1个汉字占 2 2 2个字节
不同汉字的外码(输入码)可能相同,但每个汉字的机内码唯一切不同
输入码有拼音码、五笔字形码等
汉字机内码中,用十六进制表示 7 F 7F 7F以上是汉字
- 图像编码:
图像存储(单位bit)=水平方向像素个数 ∗ * ∗竖直方向像素个数 ∗ * ∗颜色位深度(单位bit)
图像文件格式: B M P 、 J P E G 、 G I F 、 P N G BMP、 JPEG 、GIF、 PNG BMP、JPEG、GIF、PNG
Q:数码相机拍照并保存是什么过程?
A:编码的过程(数字化的过程)
- 声音编码:
声音存储容量(单位bit)=采样频率(Hz) ∗ * ∗量化位数(bit) ∗ * ∗声道数 ∗ * ∗时长(s)
-
立体声一般来说是2个以上声道,如题目没有明确说明,默认为两个声道
-
视频编码:
P A L PAL PAL制式每秒播放 25 25 25帧
N T S C NTSC NTSC制式每秒播放 30 30 30帧
1.4 数据管理与安全
电脑版可以直接点击下方视频放大观看
- 数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、处理和应用的过程
"应用计算机硬件和软件技术"和“有效”感觉是考点,但是在平时作业中去掉也可以视作正确
- 计算机数据的管理已经经历了人工管理、文件管理和数据库管理三个阶段
数据库系统可以避免数据在多个文件中重复出现,造成数据冗余的问题
数据库技术也分为很多种,传统数据库技术基于结构化数据开发,数据独立、数据可共享,也是现代社会数据管理的主要方式
传统数据库技术仍然被广泛使用,“传统”是相对于云计算、大数据的新技术而言的
- 数据在计算机中一般以文件的形式存储,计算机采用树形目录结构来管理文件(Windows系统中,采用了更为形象的文件夹来管理文件,但本质是相同的)
根据编码规则不同,文件格式不同
在Windows系统中,用文件拓展名来表示某些特定的文件类型 - 数据库管理的是结构化数据,大数据和云计算技术可以管理结构化数据、非结构化数据和半结构化数据
数据库管理的文件类型有多种,但不多(不多是相比于大数据和云计算而言的)
- 结构化数据是二维表结构数据,严格遵循数据格式与长度规范
- 非结构化数据没有与定义的数据模型
- 半结构化数据有一定的结构性
- 保护数据安全也需要保护存储数据的介质
保护存储数据的介质方法(主动防护):磁盘阵列、数据备份、异地容灾等手段 - 数据加密可以提升数据的保密性,数据校验可以提升数据的完整性
两者统称为数据的安全性
1.5 数据与大数据
大数据内容视频与1.4 数据管理与安全 制作在一起,可以在上方内容中打开
- 大数据的特征:
- 数据体量巨大
- 速度快:速度产生速度和处理速度都极快
- 数据类型多:各种类型的数据并存
- 价值密度低:大数据蕴含巨大价值,价值密度相对较低
- 大数据思维:
大数据改变的不仅是数据,还有人们的思维
- 大数据要分析的是全体数据,而不是抽样数据
- 大数据对于数据不再追求精确性,而是能够接受数据的混杂性,个别数据的不准确就显得不那么重要
- 不一定强调对事物因果关系的探求,更注重它们的相关性
- 大数据环境中,数据呈现动态特征,威胁用户隐私安全
保护用户隐私非常困难,但是不能放弃,用户隐私特别重要