NOI大纲——普及组——编码-CSDN博客

编码

ASCLL码

ASCII码（American Standard Code for Information Interchange，美国信息交换标准代码）是一种基于拉丁字母的字符编码方案，主要用于表示文本数据。ASCII码包含128个字符（0-127），包括控制字符（如换行、回车等）和可打印字符（如字母、数字、标点符号等）。在C++中，字符和字符串的处理是基础编程的一个重要部分。下面是C++中与ASCII码相关的一些详细内容。

ASCII字符和编码

以下是部分常用的ASCII字符及其对应的十进制和十六进制表示：

字符	十进制	十六进制	字符	十进制	十六进制
‘A’	65	0x41	‘a’	97	0x61
‘B’	66	0x42	‘b’	98	0x62
‘Z’	90	0x5A	‘z’	122	0x7A
…	…	…	…	…	…
‘0’	48	0x30	‘9’	57	0x39
’ ’	32	0x20	‘!’	33	0x21
‘\n’	10	0x0A	‘\r’	13	0x0D

在C++中使用ASCII码

字符到ASCII码转换

可以使用C++的int强制转换操作符将字符转换为对应的ASCII码值：

#include <iostream>
using namespace std;

int main() {
    char ch = 'A';
    int asciiValue = (int)ch;
    cout << "ASCII value of " << ch << " is " << asciiValue << endl;
    return 0;
}

ASCII码到字符转换

同样地，可以使用char强制转换操作符将整数（ASCII码值）转换为对应的字符：

#include <iostream>
using namespace std;

int main() {
    int asciiValue = 65;
    char ch = (char)asciiValue;
    cout << "Character for ASCII value " << asciiValue << " is " << ch << endl;
    return 0;
}

使用字符函数

C++标准库提供了一些字符处理函数，可以直接操作ASCII码：

isalpha(int c): 判断字符是否为字母。
isdigit(int c): 判断字符是否为数字。
isupper(int c): 判断字符是否为大写字母。
islower(int c): 判断字符是否为小写字母。
toupper(int c): 将字符转换为大写。
tolower(int c): 将字符转换为小写。

#include <iostream>
#include <cctype>
using namespace std;

int main() {
    char ch = 'a';
    if (isalpha(ch)) {
        cout << ch << " is a letter." << endl;
    }
    if (isdigit(ch)) {
        cout << ch << " is a digit." << endl;
    }
    cout << "Uppercase of " << ch << " is " << (char)toupper(ch) << endl;
    cout << "Lowercase of " << ch << " is " << (char)tolower(ch) << endl;
    return 0;
}

示例程序

下面是一个示例程序，展示如何遍历字符串并打印每个字符的ASCII码值：

#include <iostream>
#include <string>
using namespace std;

int main() {
    string str = "Hello, World!";
    for (char ch : str) {
        cout << "Character: " << ch << ", ASCII: " << (int)ch << endl;
    }
    return 0;
}

这个程序会输出每个字符及其对应的ASCII码值。

通过这些方法和示例，你可以在C++程序中有效地使用和处理ASCII码。

格雷码

格雷码（Gray code），又称格雷数码或反射二进制码（Reflected Binary Code），是一种二进制数字编码系统，其中连续的两个数值仅有一个位元的差异。它的特点是在转换相邻的数值时，只会有一个位元发生改变，这种性质使得格雷码在许多应用中特别有用，例如减少误码率、减少机械震动以及数字信号处理等领域。

与普通的二进制码相比，格雷码的优点在于减少了数值之间由于位元变化而引起的误解。这种码的名称来自发明者法兰克·格雷（Frank Gray），他于1947年发明了这种编码系统。

以下是格雷码的几个关键特点和应用：

特点：

最小变化：相邻的两个格雷码数值之间只有一位二进制位不同，这减少了变化时可能产生的错误。
对称性：格雷码序列是对称的，比如 3 位的格雷码序列是自反的。
无权码：格雷码不像标准二进制码那样每一位有明确的权值，它的每一位之间的关系更复杂。

生成方法：

有两种主要的方法生成格雷码：反射法和二进制转换法。

反射法：

从一位的格雷码开始：0, 1。
每次通过反射生成下一个位数的格雷码：
- 将现有的格雷码序列按原顺序排列，并在每个数前面加上0。
- 再将现有的格雷码序列按反序排列，并在每个数前面加上1。

例如，生成三位格雷码：

一位格雷码：0, 1
二位格雷码：00, 01, 11, 10
三位格雷码：000, 001, 011, 010, 110, 111, 101, 100

二进制转换法：

给定一个普通的二进制数，可以将其转换为格雷码：

保留二进制数的最高位。
从最高位开始，将每一位与其前一位进行异或操作，结果即为格雷码。

例如，将二进制数 1011 转换为格雷码：

保留最高位：1
第二位与第一位异或：1 ⊕ 0 = 1
第三位与第二位异或：0 ⊕ 1 = 1
第四位与第三位异或：1 ⊕ 1 = 0
所以，1011 的格雷码为 1110。

应用：

模拟数字信号转换：在模数转换器中，格雷码可以减少由于多位同时变化引起的错误。
机械编码器：格雷码在旋转编码器中很有用，因为它能确保在机械运动过程中每次只有一位变化，减少误差。
错误检测和纠正：格雷码由于其最小变化特性，常用于错误检测和纠正领域。

通过上述特性和应用，格雷码在数字系统设计、编码理论以及一些特定的硬件实现中都发挥了重要作用。

哈夫曼编码

哈夫曼编码是一种高效的无损数据压缩算法，通过使用不同长度的二进制编码来表示不同频率的字符。以下是哈夫曼编码的详细步骤：

1. 统计字符频率

首先，统计待压缩数据中每个字符出现的频率。例如，假设我们要压缩的字符串是 ABRACADABRA，我们可以得到如下字符频率：

A: 5
B: 2
R: 2
C: 1
D: 1

2. 构建优先队列

将每个字符和其频率作为一个节点，并将这些节点放入一个优先队列（最小堆），优先队列根据频率排序。初始状态下，每个节点都是一棵单节点的树。

3. 构建哈夫曼树

通过以下步骤构建哈夫曼树：

从优先队列中取出两个频率最小的节点（树）。
创建一个新节点，其频率是这两个节点频率之和。
将这两个节点作为新节点的子节点，新节点的频率是这两个节点频率之和。
将新节点插入优先队列。
重复上述步骤，直到优先队列中只剩下一个节点。这个节点就是哈夫曼树的根节点。

以 ABRACADABRA 为例，构建哈夫曼树的过程如下：

初始节点: [A: 5, B: 2, R: 2, C: 1, D: 1]
第一次合并: [A: 5, B: 2, R: 2, CD: 2] （C 和 D 合并）
第二次合并: [A: 5, BR: 4, CD: 2] （B 和 R 合并）
第三次合并: [A: 5, BRC: 6] （CD 和 BR 合并）
第四次合并: [ABRC: 11] （A 和 BRC 合并）

4. 生成哈夫曼编码

从根节点开始，为左子节点分配0，为右子节点分配1。这样，每个叶子节点（字符）从根节点到叶子节点路径上的0和1串联起来就构成了该字符的哈夫曼编码。

以构建的哈夫曼树为例：

A: 0
B: 101
R: 100
C: 110
D: 111

5. 编码

将原始数据中的每个字符用其对应的哈夫曼编码替换。例如，字符串 ABRACADABRA 可以编码为：

A B  R  A  C  A  D  A  B  R  A
0 101 100 0 110 0 111 0 101 100 0

编码后的二进制串为：0101100011010001110100110100。

6. 解码

解码时，根据哈夫曼树，从根节点开始读取编码，遇到0则向左，遇到1则向右，直到到达叶子节点，从叶子节点得到一个字符，然后返回根节点继续解码下一个字符。这样可以准确地将编码的二进制串还原为原始字符串。

通过上述过程，哈夫曼编码利用字符的频率信息生成了高效的二进制编码，实现了无损数据压缩。

7. 应用

1. 文件压缩

哈夫曼编码是很多文件压缩算法的核心组件，例如ZIP、GZIP、7z等。通过对文件中字符的频率进行分析，哈夫曼编码可以生成最优的编码表，减少文件的存储空间。

2. 图像压缩

在图像压缩中，特别是无损压缩格式如PNG，哈夫曼编码被用于压缩图像中的像素数据。它通过减少图像数据的冗余，提高存储和传输的效率。

3. 视频压缩

在视频压缩格式中，如MPEG和H.264，哈夫曼编码用于对视频数据进行无损压缩。它在减少视频文件大小的同时，保持高质量的视频输出。

4. 音频压缩

在音频压缩中，哈夫曼编码用于无损音频格式（如FLAC）和有损音频格式（如MP3）。通过对音频样本数据进行编码，减少音频文件的大小。

5. 数据传输

在数据传输过程中，哈夫曼编码被用来减少数据包的大小，提高传输效率。它在网络通信协议中也有所应用，特别是在带宽有限的环境中。

6. 编译器设计

哈夫曼编码在编译器设计中用于优化符号表和编码。它可以通过对程序中出现频率高的符号进行压缩，减少编译结果的大小。

7. 信息检索

在信息检索系统中，哈夫曼编码用于压缩索引文件和倒排索引，提高查询效率和减少存储空间。

8. DNA序列压缩

在生物信息学中，哈夫曼编码用于压缩DNA序列数据。由于DNA序列中存在大量重复数据，哈夫曼编码可以有效减少序列的存储空间。