C/C++使用过程中的溢出问题

本文详细分析了C/C++编程中常见的数组溢出、整数溢出、缓冲区溢出、栈溢出和指针溢出问题,以及如何通过正确编码避免这些问题。
摘要由CSDN通过智能技术生成

内容:在C/C++程序里有一类非常典型的问题,那就是:溢出问题。现在分别来分析一下常见的数组溢出,整数溢出,缓冲区溢出,栈溢出和指针溢出等。

目录

1、数组溢出

2、整数溢出

3、缓冲区溢出

4、栈溢出

5、指针溢出

6、字符串溢出


1、数组溢出

在C语言中,数组的元素下标是从0开始计算的,所以,对于n个元素的数组a[n], 遍历它的时候是a[0],a[1],...,a[n-1],如果遍历到a[n],数组就溢出了。 
void print_array(int a[], int n)
{
    for (int i = 0; i < n; i++) 
    {
        a[i] = a[i+1];//当i = n-1时,就发生了数组越界
        printf(“%d\n”, a[i]);
    }
}
上面的循环判断应该改为:
for (int i = 0; i < n-1; i++)

2、整数溢出

整数的溢出分为下溢出和上溢出。比如,对于有符号的char(signed char)类型来说,它能表示的范围为:[-128,127]之间;而对于无符号的char(unsigned char)来说, 它能表示的范围为:[0,255]。
那么,对于下面的代码:
signed char c1 = 127;
c1 = c1+1;//发生上溢出,c1的值将变为-128
signed char c2 = -128;
c2 = c2-1;//发生下溢出,c2的值将变为127
unsigned char c3 = 255;
c3 = c3+1;//发生上溢出,c3的值将变为0
unsigned char c4 = 0;
c4 = c4-1;//发生下溢出,c4的值将变为255
从上面的例子可以看出,当一个整数向上溢出,将会变为最小值,而向下溢出,将会变为最大值。

来看下面的溢出代码,该代码负责提供一个小写字母转换表,但存在一个整数溢出问题:
void BuildToLowerTable( void ) /* ASCII版本*/
{
    unsigned char ch;
    /* 首先将每个字符置为它自己 */
    /*ch为unsigned char,无符号数,当ch值为UCHAR_MAX, ch++将会发生向上溢出,变为0,导致循环无法退出。*/
    for (ch=0; ch <= UCHAR_MAX;ch++)
        chToLower[ch] = ch;
    /* 将大写字母改为小写字母 */
    for( ch = ‘A’; ch <= ‘Z’; ch++ )
        chToLower[ch] = ch +’a’ – ‘A’;
}
该代码负责在内存中查找指定的字符ch,但也存在一个溢出问题
void * memchr( void *pv, unsigned char ch, size_t size )
{
    unsigned char *pch = (unsigned char *) pv;
    /*当size的值为0的时候,由于size是无符号整数,因此会发生下溢出,变为一个最大的整数 循环也将无法退出*/ 
    while( -- size >=0 )
    {
        if( *pch == ch )
            return (pch );
        pch++;
    }
    return( NULL );
}

3、缓冲区溢出

缓冲区溢出一般是调用了一些不安全的字符串操作函数比如:strcpy,strcat等(这些字符串操作函数在拷贝或者修改目标位置的时候,并不判断长度是否会超过目标缓存),或者设置参数超过了目标缓存能容纳的大小而造成的溢出问题。
void func1(char* s)
{
    char buf[10];
    /*此时,buf只有10个字节,如果传入的s超过10个字节,就会造成溢出*/
    strcpy(buf, s);
}
void func2(void)
{
    printf("Hacked by me.\n");
    exit(0);
}
int main(int argc, char* argv[])
{
    char badCode[] = "aaaabbbb2222cccc4444ffff";
    DWORD* pEIP = (DWORD*)&badCode[16];
    *pEIP = (DWORD)func2;
    /*badCode字符串超过了10个字节,传递给func1会造成栈上缓冲区溢出
    而且,由于badCode经过精心构造,在溢出的时候,根据函数的调用约定规则,会覆盖栈上的返回地址,
    指向了func2。所以,在func1退出的时候,会直接调用func2
    */
    func1(badCode);
    return 0;
}

4、栈溢出


无论是内核栈,还是应用层的栈,都是有一定大小限制的。如果在栈上分配的空间大于了这个限制,就会造成栈大小溢出,破坏栈上的数据。比如局部变量过多,或者递归调度嵌套太深都会造成栈溢出。比如:
int init_module(void)
{
    char buf[10000]; //buf[]分配在栈上,但10000的空间超过了栈的默认大小8KB。
    //所以发生溢出
    memset(buf,0,10000);
    printk("kernel stack.\n");
    return 0;
}
void cleanup_module(void)

    printk("goodbye.\n");
}
MODULE_LICENSE("GPL");
//应用栈的大小对少?内核栈的大小多少?什么时候容易栈溢出?

5、指针溢出

一块长度为size大小的内存buffer,buffer的首地址为p,那么buffer最后一个字节的地址:
p+size-1,而不是p+size。如果写成了p+size,就会造成溢出,比如下面的代码:
void* memchr( void *pv, unsigned char ch, size_t size )
{
    unsigned char *pch = ( unsigned char * )pv;
    unsigned char *pchEnd = pch + size;
    while( pch < pchEnd )
    {
        if( *pch == ch )
            return ( pch );
        pch ++ ;
    }
    return( NULL );
}

上面的代码用于查找内存中特定的字符位置。对于其中的while()循环,平时执行似乎都没有任何问题。但是,考虑一种特别情况,即pv所指的内存位置为末尾若干字节,那么因为pchEnd = pch+size,所以pchEnd指向最后一个字符的下一个字节,将会超出内存的范围,即pchEnd所指的位置已经不存在。
知道了问题所在,那么可以将内存的结尾计算方式改为: 
pchEnd = pv + size – 1; 
while ( pch <= pchEnd ) 
{
        if( *pch == ch )
            return ( pch );
        pch ++ ;
}
…… 
pchEnd指向了最后一个字节。但是,检查循环内部的执行情况可知,由于pch每增加到pchEnd+1时,都会发生上溢。因此,循环将无法退出。 于是,可以将程序修改为下面的代码。将用size变量来控制循环的退出。这样就不会存在任何问题了。
void *memchr( void *pv, unsigned char ch, size_t size )
{
    unsigned char *pch = ( unsigned char * )pv;
    while( size -- > 0 )
    {
        if( *pch == ch )
            return( pch );
        pch ++;
    }
    return( NULL );
}

大家知道,--size的效率一般比size--的效率高。那么是否可以将循环的判断条件改为下面的语句呢? 
while( --size >= 0 ) 
…… 

实际上这是不行的。因为当size=0时,由于size是无符号数,那么它将发生下溢,变成了size所能表示的最大正数,循环也将无法退出。 

6、字符串溢出

我们已经知道,字符串是'\0'结尾的。如果字符串结尾忘记带上'\0',那么就溢出了。注意,strlen(p)计算的是字符串中有效的字符数(不含’\0’)。考察下面拷贝字符串的代码,看看有什么问题没呢?

char *str = “Hello, how are you!”;

char *strbak = (char *)malloc(strlen(str));

if (NULL == strbak)

{

//处理内存分配失败,返回错误

}

strcpy(strbak, str);

......

显然,由于strlen()计算的不是str的实际长度(即不包含’\0’字符的计算),所以strbak没有结束符’\0’,而在C语言中,’\0’是字符串的结束标志,所以是必须加上的,否则会造成字符串的溢出。所以上面的代码应该是:

char *str = “Hello, how are you!”;

char *strbak = (char *)malloc(strlen(str)+1);

if (NULL == strbak)

{

    //内存分配失败,返回错误

}

strcpy(strbak, str);

  • 18
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PL/0编译程序的语法分析部分通常使用递归下降法进行实现。在C/C++语言,可以使用函数来实现递归下降分析。 首先,需要定义PL/0语言的文法规则,例如: ``` <程序> ::= <分程序>. <分程序> ::= [<常量说明部分>][<变量说明部分>][<过程说明部分>]<语句> <常量说明部分> ::= const<常量定义>{,<常量定义>}; <常量定义> ::= <标识符>=<无符号整数> <无符号整数> ::= <数字>{<数字>} <变量说明部分> ::= var<标识符>{,<标识符>}; <标识符> ::= <字母>{<字母>|<数字>} <过程说明部分> ::= <过程首部><分程序>;{<过程说明部分>} <过程首部> ::= procedure<标识符>; <语句> ::= <赋值语句>|<条件语句>|<当型循环语句>|<过程调用语句>|<读语句>|<写语句>|<复合语句>|<重复语句>|<空> <赋值语句> ::= <标识符>:=<表达式> <条件语句> ::= if<条件>then<语句>[else<语句>] <条件> ::= <表达式><关系运算符><表达式>|odd<表达式> <关系运算符> ::= =|<>|<|<=|>|>= <当型循环语句> ::= while<条件>do<语句> <过程调用语句> ::= call<标识符> <读语句> ::= read(<标识符>{,<标识符>}) <写语句> ::= write(<表达式>{,<表达式>}) <复合语句> ::= begin<语句>{;<语句>}end <重复语句> ::= repeat<语句>{;<语句>}until<条件> <表达式> ::= [+|-]<项>{<加减运算符><项>} <项> ::= <因子>{<乘除运算符><因子>} <因子> ::= <标识符>|<无符号整数>|(<表达式>) <加减运算符> ::= +|- <乘除运算符> ::= *|/ ``` 然后,可以根据文法规则,定义C/C++函数来实现递归下降分析。例如,可以定义一个函数`void program()`来表示文法规则的`<程序>`: ```C++ void program() { if (sym == constsym) { constdeclaration(); } if (sym == varsym) { vardeclaration(); } while (sym == procsym) { proceduredeclaration(); } statement(); if (sym != periodsym) { error(9); //缺少句号 } } ``` 在函数,可以通过判断当前的符号类型(`sym`)来进行不同的处理。例如,如果当前符号是`constsym`,则调用`constdeclaration()`函数来处理常量说明部分。 以上仅是一个简单的示例,实际的语法分析函数可能要更加复杂。在实现递归下降分析时,需要注意避免死循环和栈溢出问题。同时,可以使用语法制导翻译来实现语义分析和代码生成等功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值