【高能笔记】数据与信息

本系列为高中信息技术笔记,有需要的小伙伴可以持续关注哦

文章格式介绍
  1. 此类注释框为重点内容强调和我对于重要内容的理解

  2. 重难点采用加粗标出

  3. 删除线 为玩笑内容或错误内容

  4. 此类文字表示常见或易错的问题或代码语句

当内容多行时,也会用代码块


  1. 此类内容为超链接,一般会显示蓝色,点击即可跳转

  2. 斜体样式表示专用名词

  3. 所有的数学公式、符号等,均采用 L a T e X ;数字等均采用此格式 所有的数学公式、符号等,均采用LaTeX;数字等均采用此格式 所有的数学公式、符号等,均采用LaTeX;数字等均采用此格式


本章为普通高中教科书信息技术必修一数据与计算的第一章


1.1 感知数据

  • 数据在当今社会体现出前所未有的价值
  • 计算机已成为数据处理的主要工具

数据处理的工具不只有计算机

  • 人们在利用数据的同时,自身的行为也在产生数据

人既是数据的使用者,也是数据的来源之一


1.2 数据、信息与知识

  • 数据是对客观事物的符号表示(数据的定义
  • 单纯的数据是没有意义的,因为数据的表现形式还不能完全表达其内容,经过解释,数据才变得有意义,数据和关于数据的解释是密不可分的

数据是信息的载体,文字、符号、图片、音频、视频都是数据的表现形式
数据≠信息

Q:书本是信息吗?
A:不是,书本上的文字是数据,数据经过解释才是信息。文字只是数据的表现形式,是信息的载体,书本是文字的载体
  • 信息论的奠基者是香农(这条在高二尚不重要,但在信息学奥赛中属于信息学史考察范围,高考可能会考)

  • 信息的特征:

  1. 载体依附性:信息无法独立存在,必须依附于载体同一信息可以依附于不同载体

无线传输时,信息的载体同样存在,是电磁波

  1. 时效性:信息反映事物某一时间的状态,会随着时间的推移而变化

过了这一时间后,重要性有所降低,但是仍然存在价值

  1. 共享性:信息可以共享,同一种信息可以同时被不同的接收者获取,人们可以重复利用信息,信息不会因为别人的获取而发生损耗
  2. 可加工处理性、真伪性:信息有真伪,可以被人工处理
  3. 价值性:信息具有价值;显性价值:信息本身体现的价值;隐性价值:通过信息掌握知识、技能;信息的价值是相对的,对于不同的人,不同的时间,价值可能会有所不同(但是价值不会失去)

隐形价值是指经过对信息进行分析处理,从而学习并加以利用

  • 数据—被解释后—>信息—被学习后—>知识——>智慧

数据本身没有价值没有意义
信息有价值有意义
知识是指人所拥有的、学会的、理解的信息
智慧是指人应用知识、预测未来、处理与知识相关问题的能力


1.3 数据采集与编码

  • 现代获取数据的方式:传感器、网络爬虫、互联网…
  • 模拟信号以连续变化的物理量存在
  • 数字信号在取值上是离散的、不连续的信号
  • 将模拟信号转换成数字信号的过程成为数字化,也叫模数转换
  • 数字化是信息社会的技术基础
  • 模拟信号转换成数字信号需要经过:采样、量化、编码的过程
  • 每秒的采样样本数叫做采样频率,单位为赫兹

采样频率决定了采样点的个数(采样频率也会影响保真度)
量化值决定精度、保真度

进制

视频链接:Bilibili:「十分钟一个知识点」进制【电脑版】(点击跳转)

电脑版可以直接点击下方视频放大观看

  • 进位计数制:
    将数字符号按序排列成数位,并遵照某种由低位到高位的进位方式计数表示数值的方法,称作进位计数制(非常文绉绉的,说实话是百度上抄来的 ,没啥大用,了解一下就行)

  • 十进制D:
    十进制计数制由 0 、 1 、 2 、 3 、 4 、 5 、 6 、 7 、 8 、 9 0、 1、 2、 3、 4、 5、6、 7、 8、 9 0123456789 10 10 10个数字符号组成
    相同数字符号在不同的数位上表示不同的数值
    每个数位计满十就向高位进一,即逢十进一

  • 二进制B(必会):
    二进制计数制由 0 0 0 1 1 1 2 2 2个数字组成
    每个数位计满二就向高位进一,即逢二进一

  • 八进制O(这个不太常考,了解一下就行):
    八进制计数制由 0 、 1 、 2 、 3 、 4 、 5 、 6 、 7 0、 1、 2、3、 4、 5、 6、 7 01234567 8 8 8个数字组成
    每个数位计满八就向高位进一,即逢八进一

  • 十六进制H:
    十六进制数由 0 、 1 、 2 、 3 、 4 、 5 、 6 、 7 、 8 、 9 、 A 、 B 、 C 、 D 、 E 、 F 0、 1、 2、 3、 4、 5、 6、 7、 8、 9、 A、 B、 C、 D、 E、F 0123456789ABCDEF共十六个字符组成
    逢十六进一
    不同的是用 A 、 B 、 C 、 D 、 E 、 F A、 B、 C、D、 E、F ABCDEF分别表示 10 、 11 、 12 、 13 、 14 、 15 10、 11、 12、 13、 14、15 101112131415六个数字

  • 十进制转换成 N N N进制——短除法

  • N N N进制转换成十进制——加权相加法

以上两个方法由于文字描述不够清晰,请观看视频学习

编码
  • 编码是信息按照编码规则,从一种形式转换为另一形式,解码是编码的逆过程
Q:手机扫描二维码识别信息是编码过程吗?
A:不是,生成二维码是编码过程,扫描二维码是解析(解码)过程
  • 无论什么形式的数据,最终存在计算机里是二进制数字
数据存储容量单位
  • 0 0 0/ 1 1 1”的二进制数的位数就是几位
  • “位”叫做比特(bit)
  • 比特是最小的存储单位
  • 8位=1字节(Byte) Byte往往会缩写成B
  • 字节是最基本的存储单位
1KB=1024B
1MB=1024KB
1GB=1024MB
1TB=1024GB
1PB=1024TB
  • 单位转换间均是 2 10 2^{10} 210

  • 汉字编码:
    1 1 1个汉字占 2 2 2个字节
    不同汉字的外码(输入码)可能相同,但每个汉字的机内码唯一切不同

输入码有拼音码、五笔字形码等
汉字机内码中,用十六进制表示 7 F 7F 7F以上是汉字

  • 图像编码:
    图像存储(单位bit)=水平方向像素个数 ∗ * 竖直方向像素个数 ∗ * 颜色位深度(单位bit)

图像文件格式: B M P 、 J P E G 、 G I F 、 P N G BMP、 JPEG 、GIF、 PNG BMPJPEGGIFPNG

Q:数码相机拍照并保存是什么过程?
A:编码的过程(数字化的过程)
  • 声音编码:

声音存储容量(单位bit)=采样频率(Hz) ∗ * 量化位数(bit) ∗ * 声道数 ∗ * 时长(s)

  • 立体声一般来说是2个以上声道,如题目没有明确说明,默认为两个声道

  • 视频编码:
    P A L PAL PAL制式每秒播放 25 25 25
    N T S C NTSC NTSC制式每秒播放 30 30 30


1.4 数据管理与安全

视频观看:Bilibili:「十分钟一个知识点」数据管理与安全【电脑版】(点击跳转)

电脑版可以直接点击下方视频放大观看

  • 数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、处理和应用的过程

"应用计算机硬件和软件技术"和“有效”感觉是考点,但是在平时作业中去掉也可以视作正确

  • 计算机数据的管理已经经历了人工管理、文件管理和数据库管理三个阶段
    数据库系统可以避免数据在多个文件中重复出现,造成数据冗余的问题
    数据库技术也分为很多种,传统数据库技术基于结构化数据开发,数据独立、数据可共享,也是现代社会数据管理的主要方式

传统数据库技术仍然被广泛使用,“传统”是相对于云计算、大数据的新技术而言的

  • 数据在计算机中一般以文件的形式存储,计算机采用树形目录结构来管理文件(Windows系统中,采用了更为形象的文件夹来管理文件,但本质是相同的)
    根据编码规则不同,文件格式不同
    在Windows系统中,用文件拓展名来表示某些特定的文件类型
  • 数据库管理的是结构化数据,大数据和云计算技术可以管理结构化数据、非结构化数据和半结构化数据

数据库管理的文件类型有多种,但不多(不多是相比于大数据和云计算而言的)

  • 结构化数据是二维表结构数据,严格遵循数据格式与长度规范
  • 非结构化数据没有与定义的数据模型
  • 半结构化数据有一定的结构性
  • 保护数据安全也需要保护存储数据的介质
    保护存储数据的介质方法(主动防护):磁盘阵列、数据备份、异地容灾等手段
  • 数据加密可以提升数据的保密性,数据校验可以提升数据的完整性

两者统称为数据的安全性


1.5 数据与大数据

大数据内容视频与1.4 数据管理与安全 制作在一起,可以在上方内容中打开

  • 大数据的特征:
  1. 数据体量巨大
  2. 速度快:速度产生速度和处理速度都极快
  3. 数据类型多:各种类型的数据并存
  4. 价值密度低:大数据蕴含巨大价值,价值密度相对较低
  • 大数据思维:
    大数据改变的不仅是数据,还有人们的思维
  1. 大数据要分析的是全体数据,而不是抽样数据
  2. 大数据对于数据不再追求精确性,而是能够接受数据的混杂性,个别数据的不准确就显得不那么重要
  3. 不一定强调对事物因果关系的探求,更注重它们的相关性
  • 大数据环境中,数据呈现动态特征,威胁用户隐私安全

保护用户隐私非常困难,但是不能放弃,用户隐私特别重要

  • 39
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值