c++内存分配(new,operator new,placement new)

本文主要讲述C++ new关键字和operator new, placement new之间的种种关联,new的底层实现,以及operator new的重载和一些在内存池,STL中的应用。

一. new operator 和 operator new

new operator:指我们在C++里通常用到的关键字,比如A* a = new A;
**operator new:**它是一个操作符,并且可被重载(类似加减乘除的操作符重载)
关于这两者的关系,我找到一段比较经典的描述(来自于www.cplusplus.com 见参考文献:

operator new can be called explicitly as a regular function, but in C++, new is an operator with a very specific behavior: An expression with the new operator, first calls function operator new (i.e., this function) with the size of its type specifier as first argument, and if this is successful, it then automatically initializes or constructs the object (if needed). Finally, the expression evaluates as a pointer to the appropriate type.
比如我们写如下代码:

A* a = new A;
我们知道这里分为三步:1.分配内存,2.调用A()构造对象,3. 返回分配指针。事实上,分配内存这一操作就是由operator new(size_t)来完成的,如果类A重载了operator new,那么将调用A::operator new(size_t ),否则调用全局::operator new(size_t ),后者由C++默认提供。因此前面的步骤也就是:

1.调用operator new (sizeof(A))
2.调用A:A()
3.返回指针
这里再一次提出来是因为后面关于这两步会有一些变形,在关于placement new那里会讲到。先举个简单例子

//平台:Visual Stdio 2008
#include<iostream>
class A
{
public:
     A()
     {
          std::cout<<"call A constructor"<<std::endl;
     }
 
     ~A()
     {
          std::cout<<"call A destructor"<<std::endl;
     }
}
int _tmain(int argc, _TCHAR* argv[])
{
 
     A* a = new A;
     delete a;
 
     system("pause");
     return 0;
}

下面我们跟踪一下A反汇编代码,由于Debug版本反汇编跳转太多,因此此处通过Release版本在A* a = new A;处设断点反汇编:
在Release版本中,构造函数和析构函数都是直接展开的。

通过反汇编可以确认A* = new A的三个步骤,delete a类似
,包含了~A()和operator delete(a)两个步骤。

二. operator new的三种形式

operator new有三种形式:

throwing (1)    
void* operator new (std::size_t size) throw (std::bad_alloc);
nothrow (2) 
void* operator new (std::size_t size, const std::nothrow_t& nothrow_value) throw();
placement (3)   
void* operator new (std::size_t size, void* ptr) throw();

(1)(2)的区别仅是是否抛出异常,当分配失败时,前者会抛出bad_alloc异常,后者返回null,不会抛出异常。它们都分配一个固定大小的连续内存。

A* a = new A; //调用throwing(1)
A* a = new(std::nothrow) A; //调用nothrow(2)

(3)是placement new,它也是对operator new的一个重载,定义于#include 中,它多接收一个ptr参数,但它只是简单地返回ptr。其在new.h下的源代码如下:

#ifndef __PLACEMENT_NEW_INLINE
#define __PLACEMENT_NEW_INLINE
inline void *__cdecl operator new(size_t, void *_P)
        {return (_P); }
#if     _MSC_VER >= 1200
inline void __cdecl operator delete(void *, void *)
    {return; }
#endif
#endif

那么它究竟有什么用呢?事实上,它可以实现在ptr所指地址上构建一个对象(通过调用其构造函数),这在内存池技术上有广泛应用。
它的调用形式为:

new(p) A(); //也可用A(5)等有参构造函数

placement new本身只是返回指针p,new§ A()调用placement new之后,还会在p上调用A:A(),这里的p可以是动态分配的内存,也可以是栈中缓冲,如char buf[100]; new(buf) A();

我们仍然可以通过一个例子来验证:

#include <iostream>
class A
{
public:
    A()
    {
        std::cout<<"call A constructor"<<std::endl;
    }
 
    ~A()
    {
        std::cout<<"call A destructor"<<std::endl;
    }
};
int _tmain(int argc, _TCHAR* argv[])
{
 
    A* p = (A*)::operator new(sizeof(A)); //分配
 
    new(p) A(); //构造
 
    p->~A();   //析构
 
    ::operator delete(p); //释放
 
    system("pause");
    return 0;
}

上面的代码将对象的分配,构造,析构和释放分离开来,这也是new和delete关键字两句就能完成的操作。
先直接运行可以看到程序输出:

call A constructor
call A destructor

再分别注释掉new(a) A();和a->~A();两句,可以看到对应的构造和析构函数将不会被调用。

事实上,在指定地址上构造对象还有另一种方法,即手动调用构造函数:p->A::A(); 这里要加上A::作用域,用p->A::A();替换掉new§ A();仍然能达到同样的效果.

比之前的方法更加简洁高效(不需要调用placement new)。不知道手动调用构造函数是否有违C++标准或有什么隐晦,我在其他很多有名的内存池(包括SGI STL alloc)实现上看到都是用的placement new,而不是手动调用构造函数。

三. operator new重载

前面简单提到过A* p = new A;所发生的事情:先调用operator new,如果类A重载了operator new,那么就使用该重载版本,否则使用全局版本::operatro new(size_t size)。

上面提到的throwing(1)和nothrow(2)的operator new是可以被重载的,比如:

#include <iostream>
class A
{
public:
    A()
    {
        std::cout<<"call A constructor"<<std::endl;
    }
 
    ~A()
    {
        std::cout<<"call A destructor"<<std::endl;
    }
    void* operator new(size_t size)
    {
        std::cout<<"call A::operator new"<<std::endl;
        return malloc(size);
    }
 
    void* operator new(size_t size, const std::nothrow_t& nothrow_value)
    {
        std::cout<<"call A::operator new nothrow"<<std::endl;
        return malloc(size);
    }
};
int _tmain(int argc, _TCHAR* argv[])
{
    A* p1 = new A;
    delete p1;
 
    A* p2 = new(std::nothrow) A;
    delete p2;
 
    system("pause");
    return 0;
}

运行结果:

call A::operator new
call A constructor
call A destructor
call A::operator new nothrow
call A constructor
call A destructor

如果类A中没有对operator new的重载,那么new A和new(std::nothrow) A; 都将会使用全局operator new(size_t size)。可将A中两个operator new注释掉,并且在A外添加一个全局operator new重载:

void* ::operator new(size_t size)
{
    std::cout<<"call global operator new"<<std::endl;
    return malloc(size);
}

程序输出:

call global operator new
call A constructor
call A destructor
call global operator new
call A constructor
call A destructor

注意,这里的重载遵循作用域覆盖原则,即在里向外寻找operator new的重载时,只要找到operator new()函数就不再向外查找,如果参数符合则通过,如果参数不符合则报错,而不管全局是否还有相匹配的函数原型。比如如果这里只将A中operator new(size_t, const std::nothrow_t&)删除掉,就会报错:

error C2660: “A::operator new”: 函数不接受 2 个参数。
对operator new的重载还可以添加自定义参数,如在类A中添加

void* operator new(size_t size, int x, int y, int z)
{
    std::cout<<"X="<<x<<"  Y="<<y<<" Z="<<z<<std::endl;
    return malloc(size);
}

这种重载看起来没有什么大作用,因为它operator new需要完成的任务只是分配内存,但是通过对这类重载的巧妙应用,可以让它在动态分配内存调试和检测中大展身手。这将在后面operator new重载运用技巧中展现。

至于placement new,它本身就是operator new的一个重载,不需也尽量不要对它进行改写,因为它一般是搭配 new§ A(); 工作的,它的职责只需简单返回指针。

四. operator new运用技巧和一些实例探索

1. operator new重载运用于调试:

前面提到如何operator new的重载是可以有自定义参数的,那么我们如何利用自定义参数获取更多的信息呢,这里一个很有用的做法就是给operator new添加两个参数:char* file, int line,这两个参数记录new关键字的位置,然后再在new时将文件名和行号传入,这样我们就能在分配内存失败时给出提示:输出文件名和行号。

那么如何获取当前语句所在文件名和行号呢,windows提供两个宏:FILE__和__LINE。利用它们可以直接获取到文件名和行号,也就是 new(FILE, LINE) 由于这些都是不变的,因此可以再定义一个宏:#define new new(FILE, LINE)。这样我们就只需要定义这个宏,然后重载operator new即可。

源代码如下,这里只是简单输出new的文件名和行号。

 //A.h
class A
{
public:
    A()
    {
        std::cout<<"call A constructor"<<std::endl;
    }
 
    ~A()
    {
        std::cout<<"call A destructor"<<std::endl;
    }
 
    void* operator new(size_t size, const char* file, int line)
    {
        std::cout<<"call A::operator new on file:"<<file<<"  line:"<<line<<std::endl;
        return malloc(size);
        return NULL;
    }
 
};
//Test.cpp
#include <iostream>
#include "A.h"
#define new new(__FILE__, __LINE__)
 
int _tmain(int argc, _TCHAR* argv[])
{
    A* p1 = new A;
    delete p1;
 
    system("pause");
    return 0;
}

输出:

call A::operator new on file:d:\desktop\test\test.cpp line:8
call A constructor
call A destructor

注意:需要将类的声明实现与new的使用隔离开来。并且将类头文件放在宏定义之前。否则在类A中的operator new重载中的new会被宏替换,整个函数就变成了:void* operator new(FILE, LINE)(size_t size, char* file, int line),编译器自然会报错。

2. 内存池优化

operator new的另一个大用处就是内存池优化,内存池的一个常见策略就是分配一次性分配一块大的内存作为内存池(buffer或pool),然后重复利用该内存块,每次分配都从内存池中取出,释放则将内存块放回内存池。在我们客户端调用的是new关键字,我们可以改写operator new函数,让它从内存池中取出(当内存池不够时,再从系统堆中一次性分配一块大的),至于构造和析构则在取出的内存上进行,然后再重载operator delete,它将内存块放回内存池。关于内存池和operator new在参考文献中有一篇很好的文章。这里就不累述了。

3. STL中的new

在SGI STL源码中,defalloc.h和stl_construct.h中提供了最简单的空间配置器(allocator)封装,见《STL源码剖析》P48。它将对象的空间分配和构造分离开来,虽然在defalloc.h中仅仅是对::operator new和::operator delete的一层封装,但是它仍然给STL容器提供了更加灵活的接口。SGI STL真正使用的并不是defalloc.h中的分配器,而是stl_alloc.h中的SGI精心打造的"双层级配置器",它将内存池技术演绎得淋漓尽致,值得细细琢磨。顺便提一下,在stl_alloc.h中并没有使用::operator new/delete 而直接使用malloc和free。具体缘由均可参见《STL源码剖析》。

五. delete的使用

delete的使用基本和new一致,包括operator delete的重载方式这些都相似,只不过它的参数是void*,返回值为void。但是有一点需要注意,operator delete的自定义参数重载并不能手动调用。比如

void* operator new(size_t size, int x)
{
    cout<<" x = "<<x<<endl;
    return malloc(size);    
}
void operator delete(void* p, int x)
{
    cout<<" x = "<<x<<endl;
    free(p);
}

如下调用是无法通过的:

A* p = new(3) A;//ok
delete(3) p;//error C2541: “delete”: 不能删除不是指针的对象

那么重载operator delete有什么作用?如何调用?事实上以上自定义参数operator delete 只在一种情况下被调用:当new关键字抛出异常时。

可以这样理解,只有在new关键字中,编译器才知道你调用的operator new形式,然后它会调用对应的operator delete。一旦出了new关键字,编译器对于这块内存是如何分配的一无所知,因此它只会调用默认的operator delete,而至于为什么不能主动调用自定义delete(而只能老老实实delete p),这个就不知道了。

细心观察的话,上面operator new用于调试的例子代码中,由于我们没有给出operator new对应的operator delete。在VS2008下会有如下警告:

warning C4291: “void *A::operator new(size_t,const char *,int)”: 未找到匹配的删除运算符;如果初始化引发异常,则不会释放内存
六. 关于new和内存分配的其他

  1. set_new_handler

还有一些零散的东西没有介绍到,比如set_new_handler可以在malloc(需要调用set_new_mode(1))或operator new内存分配失败时指定一个入口函数new_handler,这个函数完成自定义处理(继续尝试分配,抛出异常,或终止程序),如果new_handler返回,那么系统将继续尝试分配内存,如果失败,将继续重复调用它,直到内存分配完毕或new_handler不再返回(抛出异常,终止)。下面这段程序完成这个测试:

#include <iostream>
#include <new.h>// 使用_set_new_mode和set_new_handler
void nomem_handler()
{
    std::cout<<"call nomem_handler"<<std::endl;
}
int main()
{
    _set_new_mode(1);  //使new_handler有效
    set_new_handler(nomem_handler);//指定入口函数 函数原型void f();
    std::cout<<"try to alloc 2GB memory...."<<std::endl;
    char* a = (char*)malloc(2*1024*1024*1024);
    if(a)
        std::cout<<"ok...I got it"<<std::endl;
    free(a);
    system("pause");
}

程序运行后会一直输出call nomem_handler 因为函数里面只是简单输出,返回,系统尝试分配失败后,调用nomem_handler函数,由于该函数并没有起到实际作用(让可分配内存增大),因此返回后系统再次尝试分配失败,再调用nomem_handler,循环下去。
在SGI STL中的也有个仿new_handler函数:oom_malloc

  1. new分配数组

new[]和new类似,仍然会优先调用类中重载的operator new[]。另外还要注意的是,在operator new[](size_t size)中传入的并不是sizeof(A)*3。而要在对象数组的大小上加上一个额外数据,用于编译器区分对象数组指针和对象指针以及对象数组大小。在VS2008(32 bit)下这个额外数据占4个字节,一个int大小。测试代码如下

//A.h
class A
{
public:
    A()
    {
        std::cout<<"call A constructor"<<std::endl;
    }
 
    ~A()
    {
        std::cout<<"call A destructor"<<std::endl;
    }
 
    void* operator new[](size_t size)
    {
        std::cout<<"call A::operator new[] size:"<<size<<std::endl;
        return malloc(size);
    }
    void operator delete[](void* p)
    {
        std::cout<<"call A::operator delete[]"<<std::endl;
        free(p);
    } 
    void operator delete(void* p)
    {
        free(p);
    } 
};
//Test.cpp
#include <iostream>
#include "A.h"
 
void* operator new[](size_t size)
{
    std::cout<<"call global new[] size: "<<size<<std::endl;
    return malloc(size);
}
 
void operator delete[](void* p)
{
    std::cout<<"call global delete[] "<<std::endl;
}
int _tmain(int argc, _TCHAR* argv[])
{
    std::cout<<"sizeof A "<<sizeof(A)<<std::endl;
    A* p1 = new A[3];
    delete []p1;
 
    system("pause");
    return 0;
}

输出:

sizeof A 1
call A::operator new[] size:7
call A constructor
call A constructor
call A constructor
call A destructor
call A destructor
call A destructor
call A::operator delete[]

简单跟踪了一下,operator new[]返回的是0x005b668 而最后new关键字返回给p的是0x005b66c。也就是说p就是数组的起始地址,这样程序看到的内存就是线性的,不包括前面的额外数据。

在内存中,可以看到前面的四个字节额外数据是0x00000003 也就是3,代表数组元素个数。后面三个cd是堆在Debug中的默认值(中文的cdcd就是”屯”,栈的初始值为cc,0xcccc中文”烫”)。再后面的0xfdfdfdfd应该是堆块的结束标志,前面我有博客专门跟踪过。

注:其实在malloc源码中也有内存池的运用,而且也比较复杂。最近在参考dlmalloc版本和STL空间适配器,真没有想到一个内存分配能涉及这么多的东西。

补充:

new hander

当operator new 没能力为分配说申请的memory,抛出一个std::bad_alloc exception。某些老编译器会返回0,但也可以手动设置 new (nothrow)Foo。
抛出exception之前会(不止一次)调用一个可由client指定的handler,以下是new handler的形式和设定方法:

typedef void(*new_handler)();
new_handler set_new_handler(new_handler P) throw();
%set_new_handler是由标准库提供的

设计良好的new_handler只有两个选择:1.让更多的memory可用;2.调用abort()或exit();
eg:(新版编译器不支持申请大数组,可用while循环实现)
在这里插入图片描述

=default,=delete

=default 表示该函数以默认的方式调用(默认存在的情况下才可使用)
.=delete表示将该函数删除,删除后不可再调用
如下例子所示:
在这里插入图片描述

七. 参考文献:

1.http://www.cplusplus.com/reference/new/operator%20new/?kw=operator% operator new的三种形式
2.http://www.relisoft.com/book/tech/9new.html c++ operator new重载和内存池技术
3.《STL源码剖析》 空间配置器
4. http://blog.csdn.net/songthin/article/details/1703966 一篇关于理解C++ New的好文
5. http://blog.csdn.net/solstice/article/details/6198937 陈硕的Blog

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值