一、数据结构分类
1、常见数据结构
数组、链表、栈、队列、哈希表、树、堆、图,它们可以从“逻辑结构”和“物理结构”两个维度进行分类。
2、逻辑结构
从逻辑结构的角度可以分为线性数据结构和非线性数据结构,其中线性数据结构是一对一的线性关系,非线性数据结构是一对多、多对多的非线性关系。
- 线性数据结构:数组、链表、栈、队列、哈希表
- 非线性数据结构:树、堆、图、哈希表
a.树形结构(一对多):树、堆、哈希表
a.网状结构(多对多):图
3、物理结构
物理结构反映了数据在计算机内存中的存储方式,可分为连续空间存储(数组)和分散空间存储(链表)。所有数据结构都是基于数组、链表或二者的组合实现的。
- 基于数组可实现:栈、队列、哈希表、树、堆、图、矩阵、张量(维度≥3的数组)等。
- 基于链表可实现:栈、队列、哈希表、树、堆、图等。
二、基本数据类型
基本数据类型是 CPU 可以直接进行运算的类型,以二进制的形式存储在计算机中。一个二进制位即为1比特,1字节(byte)由8比特(bit)组成。
三、数字编码
1、原码、反码、补码
数字是以“补码”的形式存储在计算机中的,但由于负数的原码不能直接用于运算,所以引入反码,先将原码转换为反码,并在反码下计算,最后将结果从反码转换回原码,又因为数字零的原码有-0和+0两种表示,对应两个不同的二进制编码,这可能会带来歧义,所以又引入补码。
- 原码:二进制表示的最高位视为符号位(0表示正数,1表示负数),其余位的0和1表示数字的值。
- 反码:正数的反码与其原码相同,负数的反码是对其原码除符号位外的所有位取反。
- 补码:正数的补码与其原码相同,负数的补码是在其反码的基础上加1。
2、浮点数编码
浮点数的二进制编码由符号位S、指数位E、分数位N组成
转化到十进制下的计算公式为:
四、字符编码
在计算机中,所有数据都是以二进制数的形式存储的,字符 char 也不例外。为了表示字符,将每个字符和二进制数之间建立了一一对应的关系。
- ASCII 字符集:英文字符
- GBK 字符集:中文字符
- Unicode 字符集:全球范围的字符
- UTF-8 编码:一种可变长度的编码,可以向下兼容 ASCII 码,另外还有UTF-16 编码和UTF-32 编码