1. 字段的表示
每个字段表示成具有一定长度的字节序列。
2. 记录的表示
name | address | gender | birthday | |
0 | 30 | 286 | 287 | 190 |
内存的寻址方式以4的倍数进行(扩充为4的倍数)
name | address | gender | birthday | |
12 | 44 | 300 | 304 | 308 |
address实际应用中可变,为节约空间,定义边长记录(放在最后)。
name | gender | birthday | address | |||||
12
| 44 | 48 | 52 | 308 |
3.记录集合的存储
3.1物理邻接形式
3.2指针邻接形式
3.3二者结合
方法 | 优点 | 缺点 | 适用场景 |
物理邻接 | 查找方便 | 插入删除不方便 | |
指针邻接 | 插入删除方便 | 查找不方便 | |
上面两者结合 | 效果最好 | 适合大字段存储 |
4.数据文件的组织形式
组织形式 | 描述 | 案例 | 优点 | 缺点 |
顺序文件 | 记录按照某个搜索码的值的顺序存储 | 下图一 | 按照搜索码搜索,效率高 | 频繁插入删除,文件维护困难 |
散列文件 | 利用哈希函数,记录散列到同地址范围 | 下图二 | 随机检索,速度快 | 不支持范围查询,哈希函数难定 |
聚族文件 | 多表连接 | 下图三 | 提高多表查询 | 降低单表查询 |
按列存储 | 统计查询和OLAP |