数据局部性
- 数据局部性:现代计算机的多级缓存机制导致了一个特点;在缓存线中能使用的数据越多,程序就跑得越快。因此优化的目标就是让需要处理的数据在内存中两两相邻;
- CPU分支预测:当代CPU中,单条指令被处理成流水线模型,以便多条指令能并行处理。当if else等语句出现时,CPU必须进行分支预测,并在流水线中载入预测的命令。预测错误,会导致清理流水线,造成性能损耗。关键代码中避开控制流语句。
- 优化例子:
- 连续数组:假设有一个GameEntity数组,储存了若干实体,每一个实体有物理组件、AI组件、渲染组件,那么如何存储这些组件呢?
- 方式1:实体用指针指向上述组件。将会指向多个不同的内存区域,每当update一次所有GameEntity的组件时,会不断发生命中失败(Cache Missing),从而频繁加载内存缓存线
- 方式2:用这些组件本身的数组来构建致密的连续内存区域。符合内存的一致性(数据局部性),将大大减少命中失败的可能性;
- 包装数据:使用数据保存组件,将激活的组件都放在数组头部,每次只更新激活的组件。防止判断组件是否激活时,防止加载未激活的组件到缓存,同时防止CPU分支预测错误,造成的开销。
- 冷热分解:一个GameEntity实体中,有若干数据是不常被使用到的。则可以将这些“冷数据”以指针索引的方式,不会占用太多宝贵的CPU缓存空间;而频繁使用的“热数据”则通过保存在致密的数组中,以提高数据局部性。
- 连续数组:假设有一个GameEntity数组,储存了若干实体,每一个实体有物理组件、AI组件、渲染组件,那么如何存储这些组件呢?