[C++] 空间申请且定制内存对齐

std::aligned_storage

std::aligned_storage的参数定义

  • 第一个模板参数是storage的bytes大小
  • 第二个模板参数是存储空间对齐的byte大小,且必须是2次幂
  • std::aligned_storage创建一个raw 存储空间(没有确定类型),且按照第二个参数对齐;所以要使用的话,需要转化为实际的类型。
#include <type_traits>
// Create 1024B size of storage aligned to 128 bytes
using AlignedWorkspace = std::aligned_storage<1024, 128>::type; 
AlignedWorkspace data;
float* ptr = reinterpret_cast<float*>(&data); 
*ptr = 3.14f;

std::aligned_storage 使用实例

  • oneflow工程中,在kernel优化过程中,将一些数据打包成一个pack,提高访存效率。
// 空间大小和空间对齐相同,这符合cuda申请空间的原则,也就是类型大小和对齐是一致的。
// 下面用模板包装了一个空间对齐的pack 类型。
template <typename Type, int pack_size>
struct GetPackType {
  using type = typename std::aligned_storage<pack_size * sizeof(Type),
                                             pack_size * sizeof(Type)>::type;
};
template<typename Type, int pack_size>
using PackType = typename GetPackType<Type, pack_size>::type;
template <typename Type, int pack_size>
union Pack {
  // TODO: add judgement
  // static_assert(sizeof(PackType<Type, pack_size>) == sizeof(Type) *
  // pack_size, "");
  __device__ Pack() {}
  PackType<Type, pack_size> storage; // union保持内存对齐。
  Type element[pack_size];
};

alignas说明符

  • 用于使得struct和class中member与特定字节边界对齐。
  • 对齐大小必须是2的次幂
  • alignas说明符的作用和使用:
    • 根据硬件需要,进行对齐时使用
    • 去避免padding,可以使struct最小化
    • 对齐member到cache行的边界,这个在cpu优化过程中,避免cache行中由于没有对齐导致访存增加的问题。
    • ABI兼容需要。
// 简单实例: 整体上char是根据前面一个属性的类型大小如int,则为4 bytes, 作为对齐大小 4bytes 来进行padding。
struct MyStruct {
  int a; // 4 bytes
  // 12 bytes padding
  alignas(16) float b; // 4 bytes
  char c; // 4 bytes
  int d; // 4 bytes
  // 4 bytes padding
}; // 32 bytes

struct MyStruct1 {
  int a; 
  float b;
  char c; 
  // 3 bytes padding
}; // 12 bytes

struct alignas(sizeof(int) * 4)  MyStruct2 {
  int a; // 4 bytes
  float b; // 4bytes
  char c; // 4 bytes
  int d; // 4 bytes
}; // 16 bytes

struct MyStruct3 {
  int a; // 4 bytes
  // 12 bytes padding
  alignas(16) float b; // 4 bytes
  char c; // 4 bytes
  long d; // 8 bytes
}; // 32 bytes

struct MyStruct4 {
  long a; // 8 bytes 
  float b; // 4 bytes
  char c;  // 1 bytes
  // 3 bytes padding
}; // 16 bytes

struct MyStruct5 {
  int a; // 4 bytes
  // 4 bytes padding
  long b; // 8 bytes
  char c;  // 1 bytes
  // 7 bytes padding
}; // 24 bytes

struct MyStruct6 {
  char a; // 1 bytes
  // 7 bytes padding
  long b; // 8 bytes
  char c;  // 1 bytes
  // 3 bytes padding
  int d; // 4 bytes
}; // 24 bytes

// oneflow中的实例
template <typename Type, int pack_size>
struct alignas(sizeof(Type) * pack_size) Packed {
  __device__ Packed(){}
  union {
    Type elem[pack_size];
  };
};
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C++中的字节对齐内存对齐)是指在分配内存时,将变量或结构体的起始地址对齐到特定的字节边界。这样做有助于提高内存访问的效率和性能。字节对齐的规则可以通过编译器选项或特定的关键字进行控制。 以下是关于C++字节对齐的一些重要概念和规则: 1. 默认对齐: - 编译器会使用默认的对齐规则来分配内存。通常,默认对齐值是被编译器设置的,一般为结构体成员中最大的对齐值。 2. 对齐值: - 对齐值是指要求变量或结构体的起始地址必须是该值的倍数。常见的对齐值有1、2、4、8等。 3. 对齐修饰符: - C++11引入了对齐修饰符 `alignas`,允许开发者显式地指定变量或结构体的对齐值。 4. 结构体字节对齐: - 结构体的字节对齐规则是,结构体的起始地址必须是其成员中最大对齐值的倍数。 - 编译器会在结构体成员之间插入填充字节,以保证对齐要求。 5. 类对象字节对齐: - 类对象的字节对齐规则与结构体类似,但还受到继承关系的影响。 - 派生类的起始地址必须满足其成员的对齐要求,并且满足其基类中最大对齐值的倍数。 为了控制字节对齐,可以使用编译器提供的特定选项(如`#pragma pack`)或关键字(如`alignas`)。具体的字节对齐规则和选项可能因编译器和平台而异,因此在编写代码时最好参考特定编译器的文档。正确的字节对齐可以提高内存访问性能,并确保与其他代码或外部系统的兼容性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值