由一次程序崩溃引起的对new表达式的再次学习

转载 2015年11月19日 15:34:34

1. 起因

某天,一个同事跟我反馈说在windows上调试公司产品的一个交易核心时出现了使用未初始化的指针导致后台服务崩溃的情况。示例代码如下所示:

struct sample
{
    int* ptr_table[4][4];
    //... other members
};

void test()
{
    sample* sample_ptr = new sample[10];
    for (int i = 0; i < 4; i++)
        sample_ptr[0].ptr_table[0][i] = new int(i);

    // 实际系统中是根据初始化数据对sample_ptr数组中的对象进行赋值,但不是所有的对象都有初始化数据;
    int* int_ptr = sample_ptr[0].ptr_table[0][0];
    if (int_ptr != NULL)
    {
        printf("ptr1 = 0x%x\n", int_ptr);
        *int_ptr = 100;
    }

    int_ptr = sample_ptr[1].ptr_table[0][0];
    if (int_ptr != NULL)
    {
        printf("ptr2 = 0x%x\n", int_ptr);
        *int_ptr = 100; // crashed here!
    }
}

使用未初始化的指针是c++的大忌,但是该代码在产品发布2年左右的时间一直没有出现过问题。唯一的区别是发布运行环境是linux,而调试环境是最近才配置好的windows环境。分别在linux下和windows下对代码进行debug,发现linux下新申请的内存被初始化为0,而windows下新申请的内存却并未初始化。

 

将sample* sample_ptr = new sample[10]这行改为sample* sample_ptr = new sample[10]()后两个系统执行的结果变一样了,都是被初始化的内存。

那么问题来了:

(1) 为什么相同的代码(new sample[10])在两个系统下表现形式不一样呢?是两个系统的内存分配机制的原因还是类库的原因?

(2) new sample[10]和new sample[10]()的区别到底是什么?

 

2. 研究

 

在c++中,一般都是以new/delete来申请和释放内存。对于以下几种new的用法,各自的区别是什么呢?

 

复制代码
1 int* p1 = new int;
2 int* p2 = new int();
3 int* p3 = new int(1);
4 // define class A;
5 A* p4   = new A;
6 A* p5   = new A();
7 A* p6   = new A[10];
8 A* p7   = new A[10]();
复制代码

 

在平时写代码的时候,对于一块新申请的内存我都会要对它进行初始化后才会去用它,一般是例如p3的直接初始化或者memset,因此对于new A和new A()两种用法的结果还真是不了解之间的区别。

 

根据《C++ Primer, Fourth Edition》中5.11节[1] The new and delete Expressions中关于new的描述,new A属于Default Initializing of Dynamically Allocated Objects动态创建对象的默认初始化),而new A()则属于Value Initializing of Dynamically Allocated Objects动态创建对象的值初始化)。

当为默认初始化操作时,若被创建的对象没有显式定义默认构造函数,则按照2.3.4节[2]Variable Initialization Rules的规则进行初始化:

  • 对象为内置类型时,任何在函数体外定义的变量都会被初始化0(全局变量或者静态变量),在函数体内定义的变量都不会进行初始化
  • 对象为类类型时,调用对象的默认构造函数

当为值初始化操作时,若被创建的对象没有显式定义默认构造函数,则认为对该对象进行初始化操作。

 

不同new的用法对应的初始化的逻辑总结如下:

  new A new A() new A(parameters)
A为内置类型 无初始化动作

进行值初始化

例A为int类型,则初始化为0

进行值初始化,A被初始化为parameters
A为calss/struct

调用默认构造函数,A中成员是否

初始化依赖于默认构造函数的实现

若自定义了默认构造函数,则调用自定义的默认构造函数。

否则调用系统默认构造函数,并对A中的成员进行值初始化

调用A的自定义构造函数

 

 

 

 

 

 

 

 

 

因此上面代码的执行结果分别为:

  • p1指向了一个未被初始化的int空间
  • p2指向了一个被初始化的int空间,其值为0
  • p3指向了一个被初始化的int空间,其值为1
  • p4指向了一个调用了默认构造函数的实例A,除非A的默认构造函数对A的成员进行初始化,否则A的成员全为未初始化变量
  • p5指向了一个调用了默认构造函数的实例A,若A自定义了默认构造函数,A成员变量的初始化依赖于自定义的默认构造函数,反之A的成员变量全为初始化后的变量
  • p6、p7指向了调用了默认构造函数的实例A的数组,其执行结果同p4、p5

 

回到之前的问题,结构体sample是没有自定义默认构造函数的,按照c++标准,new sample的执行结果是sample中的ptr_table是不会被初始化的。这个在windows上是一致的,可是在linux上为什么被初始化成了0了呢?在stackoverflow上找到了一个类似的问题[3],其答案为:“Memory coming from the OS will be zeroed for security reasons....the C standard says nothing about this. This is strictly an OS behavior. So this zeroing may or may not be present on systems where security is not a concern”。操作系统的安全机制会在用户程序申请内存时对分配的内存进行初始化,以防止别有用心的人从新申请到的内存中读取到敏感数据,例如密码等,正是由于这个linux的特性使程序在首次申请内存时总是能得到一块被初始化的内存。

关于这个安全机制我在网上并没有搜到比较官方的说明文档,也许是我的搜索方式有误或者没有找对关键词,而且发现在程序运行过程中申请的内存也总并不是被初始化了的内存,例如下面的代码:

复制代码
 1 int size = 10;
 2 {
 3     int * p1 = new int[size];
 4     for (int i = 0; i < size; i++)
 5     {
 6         p1[i] = i + 200;
 7         printf("%d\t", p1[i]);
 8     }
 9     printf("\n");
10     delete []p1;
11 }
12 
13 {
14     int * p1 = new int[size];
15     for (int i = 0; i < size; i++)
16         printf("%d\t", p1[i]);
17     delete []p1;
18 }
19 printf("\n");
复制代码

执行结果:

 

希望对这方面有了解的大神能提供一下相关的资料。

 

3. 总结

 

(1) 项目中的代码是明显不符合c++代码规范的,在逻辑上会存在使用未经初始化的指针的现象。个人认为变量的初始化不应依赖于编译器或者系统的实现,而是尽量遵照c++标准或者手工初始化。

(2) 针对class/struct类型,如果没有自定义默认构造函数,不同的new的用法会产生不同的结果,这个在以后写代码的时候要注意。

 

1:http://shouce.jb51.net/c++/0201721481/ch05lev1sec11.html

2.  http://shouce.jb51.net/c++/0201721481/ch02lev1sec3.html#ch02lev2sec13

3:http://stackoverflow.com/questions/8029584/why-does-malloc-initialize-the-values-to-0-in-gcc

 

本文为原创内容地址:http://www.cnblogs.com/morebread/p/4936441.html


相关文章推荐

Android socket 学习记录 之 执行new socket(ip, port)程序崩溃

这段时间在学习Android的socket编程,我不是专做APP的,做的是bootloader、驱动、hal、framework这个线的,也就是系统搭建和功能优化设计。为了打通这整条线,为此学习了不少...

类型的已垃圾回收委托进行了回调。这可能会导致应用程序崩溃、损坏和数据丢失。向非托管代码传递委托时,托管应用程序必须让这些委托保持活动状态,直到确信不会再次调用它们的问题的解决方法

《对“XXX::Invoke”类型的已垃圾回收委托进行了回调。这可能会导致应用程序崩溃、损坏和数据丢失。向非托管代码传递委托时,托管应用程序必须让这些委托保持活动状态,直到确信不会再次调用它们》的问题...

【C#】对“xxxx::Invoke”类型的已垃圾回收委托进行了回调。这可能会导致应用程序崩溃、损坏和数据丢失。向非托管代码传递委托时,托管应用程序必须让这些委托保持活动状态,直到确信不会再次调用。

最近在做项目的时候,出现了几次“对“xxxx::Invoke”类型的已垃圾回收委托进行了回调。这可能会导致应用程序崩溃、损坏和数据丢失。向非托管代码传递委托时,托管应用程序必须让这些委托保持活动状态,...

《软件调试的艺术》学习笔记——GDB使用技巧摘要(3)——程序崩溃处理

程序为什么会崩溃 内存中的程序布局 当某个错误导致程序突然和异常地停止执行时,程序崩溃。迄今为止最为常见的导致程序崩溃的原因是试图在未经允许的情况下访问一个内存位置。硬件会感知这件事,并执行对操作系...

《软件调试的艺术》学习笔记——GDB使用技巧摘要——程序崩溃处理

《软件调试的艺术》学习笔记——GDB使用技巧摘要——程序崩溃处理     1        程序为什么会崩溃 2       &#...

程序崩溃异常捕获

  • 2014-06-27 22:02
  • 608KB
  • 下载

IOS调试技巧:当程序崩溃的时候怎么办 iphone IOS

from:http://article.ityran.com/archives/1143 http://www.cocoachina.com/newbie/basic/2...

收集程序崩溃日志到SD卡

  • 2015-08-18 10:59
  • 5.66MB
  • 下载

filetool修复VC程序崩溃

  • 2017-06-09 11:30
  • 36KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)