有很多用例,其中alignas在多线程应用程序中很方便,这些应用程序对延迟敏感.例如.高频交易应用程序.
Alignas可以更加严格地控制CPU缓存上对象布局的方式,从而更快地访问对象.最佳使用的目标如下,这是使用alignas的用例
>您希望避免从缓存行中不必要的数据失效
>您希望优化CPU读取,以便节省CPU周期的浪费.
如何使用alignas对齐缓存行有帮助
使用1 – 避免从缓存行中不必要的数据失效
您可以使用alignas来保持单独线程使用的地址或对象在不同的高速缓存行上运行,这样一个线程就不会无意中使另一个核心的高速缓存行无效.
怎么回事:
考虑当进程中的线程在核心0上运行并写入地址xxxx时的情况.此地址现在加载到核心0的L1缓存中.
线程号2访问地址xxxx n个字节.现在,如果这两个地址碰巧都在同一个高速缓存行上,那么线程2的任何写入都将不必要使核心0的高速缓存行无效.因此,线程0被延迟,直到高速缓存行无效并再次加载.这妨碍了多线程环境中的性能.
使用2
将对象与单独的缓存行对齐,以使对象不会分布在多个缓存行中.这节省了CPU周期.例如.如果您的对象大小是例如. 118字节,最好将其与64字节对齐,因为在大多数处理器上,缓存行大小现在是64字节.
如果不这样做,则可以在64字节高速缓存行上按如下方式布置对象. (例如,对象具有118字节的实际大小并且具有自然对齐,大小变为4的倍数,因此120字节)
Cache line 1 Bytes ———->
Cache line 2
Cache line 3
由于CPU读取多个缓存行,因此您的对象将在3个CPU周期中读取.如果要优化它,请考虑使用alignas(64).这样,您的对象将始终分布在2个缓存行上.
注意事项
请注意,在考虑对齐之前,您需要仔细检查对象.原因是错误的方法会导致更多的填充,从而更多地浪费L2缓存.有一些简单的技术可以按顺序排列数据成员,从而避免浪费.
希望这有帮助,祝你好运!