31|new和delete背后:分配函数和释放函数

最常用的分配和释放函数

在第 1 讲,我提到过,当我们使用 new 和 delete 来创建和销毁对象时,实际发生的事情还是比较多的(如果忘了的话,可以去复习一下)。其中,分配内存和释放内存的操作是通过 operator new 和 operator delete 函数完成的。在最简单的 new 和 delete 形式里,我们使用的是以下两个函数:

void* operator new(size_t size);
void operator delete(void* ptr) noexcept;

operator new 和 operator delete 函数通常就被称为分配函数(allocation function)和释放函数(deallocation function)。

需要注意 operator new 是可能抛出异常的,而 operator delete 则不会抛出异常,被标为 noexcept。这和我们通常不允许在析构函数中抛出异常是完全一致的。

但这远不是这两个函数的所有形式。最典型情况,我们对于数组形式的分配(如 pArray = new Obj[42])和释放(如 delete[] pArray),有专门的分配和释放函数:

void* operator new[](size_t size);
void operator delete[](void* ptr) noexcept;

这些函数的默认实现都很简单,大致相当于:

void* operator new(size_t size)
{
  void* ptr = malloc(size);
  if (ptr == nullptr) {
    throw bad_alloc();
  }
  return ptr;
}

void operator delete(void* ptr) noexcept
{
  free(ptr);
}

void* operator new[](size_t size)
{
  return operator new(size);
}

void operator delete[](void* ptr) noexcept
{
  operator delete(ptr);
}

即,这些函数最后会转到 C 标准库里的 malloc 和 free 上,但是,分配函数在内存分配失败时的默认行为是抛异常,而非返回空指针。

你可能会想,为什么要这么中转一次呢,直接调用 malloc 和 free 不行吗?原因也很简单,这样一个中间层就是一个定制点,我们可以通过提供自己的 operator new 和 operator delete 函数来修改内存的分配和释放行为,而非直接调用 malloc 和 free。当用户不提供 operator new 和 operator delete 函数时,new 和 delete 就会调用标准库提供的版本;否则,用户提供的 operator new 和 operator delete 函数就会被使用。

具体的实现机制根据平台不同而不同。比如,在 Linux 上标准库的分配和释放函数由 libstdc++.so 共享库提供,只要链接过程中在 -lstdc++ 之前的目标文件或库文件里有分配和释放函数出现,它们就会比标准库的分配和释放函数有更高的优先权,会被所有用到分配和释放函数的地方调用,包括 libstdc++ 自身。

不过,需要留意的是,用户提供的分配和释放函数仍需跟标准的分配和释放函数有同样的接口,包括形式和语义。特别是:

分配函数不应返回空指针,而应使用 std::bad_alloc 异常表示内存分配失败

释放函数不允许抛出异常

举一个具体的例子,make_shared 函数会调用 operator new,并期待内存分配失败时会抛出异常。如果你自己提供的 operator new 替换版本抛出了异常,那 make_shared 也会有正常的失败行为;而如果你提供的 operator new 替换版本返回了空指针,那程序一般就会因为访问空指针而崩溃了——虽然我不能担保所有标准库的行为都是这样,但这样的行为至少是完全符合 C++ 标准的。

布置分配和释放函数

为了应对一些更加灵活的内存分配和释放场景,特别是考虑到有些环境完全不允许使用异常,C++ 里有所谓的布置(placement)new 和对应的分配和释放函数。我们可以在 new 时传递额外的特殊参数,编译器则会把这些额外参数传给 operator new,并利用重载机制找到正确的分配函数 。

它的最常见形式在标准库的头文件中已经定义了:

struct nothrow_t {
  explicit nothrow_t() = default;
};

extern const nothrow_t nothrow;

void* operator new(
  size_t size,
  const nothrow_t&) noexcept;
void* operator new[](
  size_t size,
  const nothrow_t&) noexcept;

这样,当我们使用 new(std::nothrow) Obj 这样的形式时,编译器会产生对 operator new(size_t, const nothrow_t&) 的调用,而这个函数就不会抛出异常了——它会跟 malloc 一样,在内存分配失败时返回空指针。

讲到这里,你可能会疑惑了:我说到了布置分配函数和释放函数,但似乎我们并不需要布置释放函数啊——确实 C++ 里也没有 delete(nothrow) ptr 这样的语法。单单对于无异常编程的场景,布置释放函数确实意义不大。但作为一种通用机制,C++ 的设计者需要考虑其他的应用场景;特别是,当布置分配函数成功而构造函数失败的情况。回想我们讲过的 new Circle(…) 的过程:

{
  void* temp = operator new(sizeof(circle));
  try {
    circle* ptr =
      static_cast<circle*>(temp);
    ptr->circle(…);
    return ptr;
  }
  catch (...) {
    operator delete(ptr);
    throw;
  }
}

对于普通的 new Obj,在构造函数发生异常时编译器会自动调用 operator delete(void*)。那对于 new(placementTag) Obj 呢?

我想你应该已经猜到了,编译器会产生一个对 operator delete(ptr, placementTag) 的调用。如果对应的 operator delete 重载不存在,那编译器则不会产生对 operator delete 的调用。此时,如果相应的 operator new 确实分配了内存的话,我们就有了内存泄漏。所以,通常我们提供布置分配函数时,都需要提供对应的布置释放函数,来应对这种情况。

事实上,标准库对布置分配函数都提供了对应的布置释放函数,即使在布置释放函数什么事都不需要做的时候。而编译器通常也会对用户只提供布置分配函数而没有提供布置释放函数的情况进行告警。

不分配内存的布置分配和释放函数

除了 nothrow 之外,另外一种常见的布置分配和释放函数的定义如下(简洁起见,我略去了数组版本):

inline void*
operator new(size_t,
             void* ptr) noexcept
{ return ptr; }

inline void
operator delete(void*,
                void*) noexcept
{}

根据这种形式,我们可以写出下面这样的代码,把对象构造在一个已经存在的缓冲区上:

shape* create_shape(void* buffer,
                    size_t size,
                    shape_type type)
{
  …
  switch (type) {
  case shape_type::circle:
    assert(size >= sizeof(circle));
    return new(buffer) circle();
  case shape_type::triangle:
    assert(size >= sizeof(triangle));
    return new(buffer) triangle();
  case shape_type::rectangle:
    assert(size >= sizeof(rectangle));
    return new(buffer) rectangle();
  …
  }
}

shape_type type = …;
char buffer[200];
auto ptr = create_shape(
  buffer, sizeof buffer, type);
// 使用 ptr
ptr->~shape();

在这个 create_shape 的实现里,我们不在堆上创建对象,而是在一个现有的缓冲区上创建对象。这时候 operator new(size_t, void*) 这个重载就能用得上了,虽然它只是简单地返回缓冲区的地址。显然,释放函数确实不需要做任何事情;但是,我们仍需用 ptr->~shape() 这样的形式显式地在缓冲区失效前对对象进行析构。

另外注意,跟大部分其他分配函数和释放函数不同,这些函数是不能被用户提供的版本替换的。

内存对齐的分配和释放函数

在 C++11 之前,C++ 要产生特殊的对象对齐,只能使用编译器厂商提供的特殊说明符。比如,要把一个结构体按 32 字节对齐,在 GCC 下我们需要这样写:

struct S {
  float v[8];
} __attribute__((aligned(32)));

到了 MSVC,我们就得写成:

__declspec(align(32)) struct S {
  float v[8];
};

这当然不那么令人满意。所幸,这个问题到了 C++11 就有了很大的缓解,我们可以使用 alignas 关键字来跨平台地处理这个问题了:

struct alignas(32) S {
  float v[8];
};

但在 C++17 之前,这样的结构体碰到 new 和 delete 依然会有问题,因为 new 和 delete 没有任何机制来处理内存对齐问题。如果你用了 new S 这样的表达式,结果的对齐仍然不会考虑结构体的对齐要求,而只是实现里的默认对齐值,通常是 8 或 16——你没有一种通用的办法来进行控制。

C++17 对此的解决方式是引入了一堆新的使用 std::align_val_t 的分配和释放函数。align_val_t 是一个枚举类,目的是给对齐值一个强类型。标准库提供的相关分配和释放函数有以下这些

void* operator new(
  size_t size, align_val_t al);
void* operator new[](
  size_t size, align_val_t al);
void* operator new(
  size_t size, align_val_t al,
  const nothrow_t&) noexcept;
void* operator new[](
  size_t size, align_val_t al,
  const nothrow_t&) noexcept;
void operator delete(
  void* ptr,
  align_val_t al) noexcept;
void operator delete[](
  void* ptr,
  align_val_t al) noexcept;
void operator delete(
  void* ptr, align_val_t al,
  const nothrow_t&) noexcept;
void operator delete[](
  void* ptr, align_val_t al,
  const nothrow_t&) noexcept;

如果我们写出 new S 这样的表达式,在 C++17 里就会自动产生一个 operator new(sizeof(S), std::align_val_t{32}) 这样的调用。系统的默认实现,或者用户提供的替换实现,都必须提供相应的对齐保证,对于 new S 可以保证返回的指针的二进制表示的最低 5 位为 0。

替换分配和释放函数

我前面已经提过,用户可以替换标准库提供的大部分分配和释放函数。作为一种可以适用多种场景、可灵活扩展的语言,我们可能出于以下的理由来替换分配和释放函数:

用来适配特定平台或环境的内存管理器

用来对内存进行跟踪和排错

用来实现内存池

……

在替换分配和释放函数时,有一个小细节需要注意一下。对于最普通的 operator new(size_t),我们一般应考虑同时提供 operator delete(void*) 和 operator delete(void*, size_t)。如果不提供的话,至少 GCC 会对此进行报警(当使用了 -Wextra 告警选项时)。

C++ 标准里规定,如果同时提供了这两个释放函数的话,编译器会优先选择带 size_t 参数的重载——从理论上讲,利用 size_t 大小参数可以获得更高的性能。Andrei Alexandrescu 更是争辩只用指针的释放函数是一个设计错误。不过,业界的惯性是巨大的。由于 Unix 和 C 的内存管理基本上是基于 malloc/free 的模式,目前对 operator delete(void*, size_t) 的实现(包括标准库里的实现)也基本上只是转发到 operator delete(void*) 而已。

类特定的分配和释放函数

分配和释放函数并不一定只能进行全局的替换。我们完全可以只对某一个类(如 Obj)替换它的分配和释放函数,这样,只有 new Obj 和 delete pObj 这样的表达式才会使用对应的分配和释放函数。代码如下所示:

class Obj {
public:
  …
  static void* operator new(size_t);
  static void operator delete(
    void* ptr) noexcept;
};

你可能想,是不是可以用类特定的分配和释放函数来实现一个内存池呢?毕竟,一个类的分配大小是固定的,应该会提供很多便利性。回答是:也对,也不对。

对的原因是,以上推理本身没有问题。

不对的原因是,目前大部分代码里已经不再直接使用 new 和 delete 来创建和销毁对象了。make_shared 函数会一次性分配对象和引用计数的空间,减少内存分配和释放的次数,因而类特定的 operator new 和 operator delete 不会被使用。list 和 map 这样的容器会把对象所需的空间和结点相关的其他信息一起分配,因而类特定的 operator new 和 operator delete 也不会被使用。而 vector 这样的容器会一次性分配多个对象所需的空间,同样不会使用类特定的 operator new 和 operator delete。

因此,总体来说,类特定的分配和释放函数在现代 C++ 里已经成了一个比较鸡肋的功能。我们也就不多展开讨论了。

当然,我们需要定制内存分配和释放行为的需求仍然在。对于容器,我们是有办法的,因为容器的分配器参数(Allocator)就是用来解决这个问题的。这个我们放在下一讲进行讨论。

内容小结

今天我们讨论了 new 和 delete 背后的一个细节,分配函数和释放函数。标准库里实现了这些函数,同时也允许用户对其进行替换,来定制程序的行为。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值