计算机组成原理之编码、进制转换和运算

孤影墨客

已于 2022-12-10 02:57:01 修改

阅读量480

点赞数

分类专栏： # 基础理论文章标签：理论

于 2022-12-08 23:35:34 首次发布

本文链接：https://blog.csdn.net/weixin_44037272/article/details/126491466

版权

基础理论专栏收录该内容

5 篇文章 0 订阅

订阅专栏

编码、进制转换和运算

编码
进制与运算
- 进制
- 定点数的表示与运算

编码

信息分类编码（Information Classifying and Coding）是标准化的一个领域，已发展成了一门学科，有自身的研究对象、研究内容和研究方法。在现代社会中，信息分类和编码是提高劳动生产率和科学管理水平的重要方法。美国新兴管理学的开创者莫里斯L· 库克（Morris L· Cooker）说：“只有当我们学会了分类和编码，做好简化和标准化工作，才会出现任何真正的科学的管理”。在信息化时代，信息的标准化工作越来越重要，没有标准化就没有信息化，信息分类编码标准是信息标准中的最基础的标准。

信息分类就是根据信息内容的属性或特征，将信息按一定的原则和方法进行区分和归类，并建立起一定的分类系统和排列顺序，以便管理和使用信息。信息编码就是在信息分类的基础上，将信息对象（编码对象）赋于有一定规律性的、易于计算机和人识别与处理的符号。具有分类编码意义的数据元素是最重要的一类数据元素。应遵照《国家经济信息系统设计与应用标准化规范》和《标准化工作导则：信息分类编码编制的基本原理和方法》（国家标准GB7026-86）关于信息分类编码的规定，按照"国际/国家标准—行业标准—企业标准"的顺序原则，引用或建立企业的信息分类编码标准。

编码是信息从一种形式或格式转换为另一种形式的过程，也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码，或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码，是编码的逆过程。

GB编码标准中，比较常用的是GB2312和GBK两种，GB2312是GBK的一个子集，GB2312编码范围是 0xA1A1 - 0xFEFE ，如果纯粹的 GB2312编码，处理起来是十分简单的，但处理GBK字符集时有些小的提示，先说说GBK编码的标准吧：
GBK 采用双字节表示，总体编码范围为 8140-FEFE，首字节在 81-FE 之间，尾字节在 40-FE 之间，剔除 xx7F 一条线。总计 23940 个码位，共收入 21886 个汉字和图形符号，其中汉字（包括部首和构件）21003 个，图形符号 883 个。

字符编码

ASCII

ASCII是“美国信息交换标准编码”的英文字头缩写

标准ASCII 码也叫基础ASCII码，使用7 位（或8位）二进制数表示128个字符，其最高位(b7)用作奇偶校验位。

UrlEncode

urlencode是一个函数，可将字符串以URL编码，用于编码处理。
URL编码(URL encoding)，也称作百分号编码(Percent-encoding)，是特定上下文的统一资源定位符 (URL)的编码机制。
适用于统一资源标识符(URI)的编码，也用于为"application/x-www-form-urlencoded" MIME准备数据，因为它用于通过HTTP的请求操作(request)提交HTML表单数据。

UrlEncode：将字符串以URL编码
返回值：字符串
函数种类：编码处理

Unicode

Unicode是计算机科学领域里的一项业界标准，包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发，1994年正式发布1.0版本，2020年发布13.0版本。

Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。

UTF-8使用4字节为每个字符编码

国际化与本地化

在信息技术领域，国际化与本地化（英文：internationalization and localization）是指修改软件使之能适应目标市场的语言、地区差异以及技术需要。

国际化是指在设计软件，将软件与特定语言及地区脱钩的过程。当软件被移植到不同的语言及地区时，软件本身不用做内部工程上的改变或修正。本地化则是指当移植软件时，加上与特定区域设置有关的信息和翻译文件的过程。

国际化和本地化之间的区别虽然微妙，但却很重要。国际化意味着产品有适用于任何地方的“潜力”；本地化则是为了更适合于“特定”地方的使用，而另外增添的特色。用一项产品来说，国际化只需做一次，但本地化则要针对不同的区域各做一次。这两者之间是互补的，并且两者合起来才能让一个系统适用于各地。

基于他们的英文单字长度过长，常被分别简称成i18n（18意味着在“internationalization”这个单字中，i和n之间有18个字母）及L10n。使用大写的L以利区分i18n中的i和易于分辨小写l与1。

其它

音频编码

根据采样定理，采样频率大于等于工作频率的二倍，才能恢复出实际波形。

声音其实是一种能量波，因此也有频率和振幅的特征，频率对应于时间轴线，振幅对应于电平轴线。波是无限光滑的，弦线可以看成由无数点组成，由于存储空间是相对有限的，数字编码过程中，必须对弦线的点进行采样。采样的过程就是抽取某点的频率值，很显然，在一秒中内抽取的点越多，获取得频率信息更丰富，为了复原波形，一次振动中，必须有2个点的采样，人耳能够感觉到的最高频率为20kHz，因此要满足人耳的听觉要求，则需要至少每秒进行40k次采样，用40kHz表达，这个40kHz就是采样率。我们常见的CD，采样率为44.1kHz。光有频率信息是不够的，我们还必须获得该频率的能量值并量化，用于表示信号强度。量化电平数为2的整数次幂，我们常见的CD位16bit的采样大小，即2的16次方。采样大小相对采样率更难理解，因为要显得抽象点，举个简单例子：假设对一个波进行8次采样，采样点分别对应的能量值分别为A1-A8，但我们只使用2bit的采样大小，结果我们只能保留A1-A8中4个点的值而舍弃另外4个。如果我们进行3bit的采样大小，则刚好记录下8个点的所有信息。采样率和采样大小的值越大，记录的波形更接近原始信号。

编码格式：PCM编码、WAV格式、MP3编码、OGG编码、MPC编码、mp3PRO编码、WMA格式、RA格式、APE格式

根据编码方式的不同，音频编码技术分为三种：波形编码、参数编码和混合编码。一般来说，波形编码的话音质量高，但编码率也很高；参数编码的编码率很低，产生的合成语音的音质不高；混合编码使用参数编码技术和波形编码技术，编码率和音质介于它们之间。

视频编码

视频是连续的图像序列，由连续的帧构成，一帧即为一幅图像。由于人眼的视觉暂留效应，当帧序列以一定的速率播放时，我们看到的就是动作连续的视频。由于连续的帧之间相似性极高，为便于储存传输，我们需要对原始的视频进行编码压缩，以去除空间、时间维度的冗余。

常见视频格式：AVI格式、DV-AVI格式、MPEG格式、DivX格式、MOV格式、ASF格式、WMV格式、RM格式、RMVB格式

图像编码

进制与运算

进制

常用进位计数法有十进制，二进制，八进制，十六进制等。

三位二进制数表示一位八进制数，四位二进制数表示一位十六进制数

将任意进制数的各位数码乘它们的权值，再把乘积累加就得到一个十进制数

定点数的表示与运算

无符号数和有符号数

有符号数：原码、补码、反码和移码

根据小数点的位置是否固定，在计算机有两种数据格式：定点表示和浮点表示

机器数的定点表示：即约定机器数中的小数点的位置固定不变。

孤影墨客

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
计算机组成原理之编码、进制转换和运算

采样的过程就是抽取某点的频率值，很显然，在一秒中内抽取的点越多，获取得频率信息更丰富，为了复原波形，一次振动中，必须有2个点的采样，人耳能够感觉到的最高频率为20kHz，因此要满足人耳的听觉要求，则需要至少每秒进行40k次采样，用40kHz表达，这个40kHz就是采样率。光有频率信息是不够的，我们还必须获得该频率的能量值并量化，用于表示信号强度。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。
复制链接

扫一扫