指针&数组使用注意事项极容易引发的错误

weixin_38066782

于 2023-10-11 17:38:24 发布

阅读量181

点赞数

文章标签：算法数据结构 c语言

本文链接：https://blog.csdn.net/weixin_38066782/article/details/133775296

版权

1. 内存泄漏（Memory Leak）

导致情况：

忘记释放内存：使用 malloc 或 calloc 分配的内存没有被 free。
条件分支：在某些条件下，可能会跳过 free。
函数提前返回：函数在 free 之前由于某种原因提前返回。
递归分配：在递归函数中分配内存但没有释放。

如何判断：

使用内存分析工具：如 Valgrind。
代码审查：检查所有的 malloc/calloc 是否有对应的 free。
运行时监控：观察程序的内存使用情况。

如何避免：

使用free释放不再使用的内存。
使用智能指针（C++）或其他自动内存管理机制。
在函数退出点统一释放内存。

具体代码实例：

#include <stdlib.h>

int main() {
    int *arr = (int*) malloc(10 * sizeof(int));  // 分配内存但没有释放
    return 0;  // 内存泄漏
}

GDB调试错误信息解析：

GDB 本身不提供内存泄漏检测。通常使用 Valgrind 进行内存泄漏检测。运行 Valgrind 后，你可能会看到类似以下的输出：

==12345== 40 bytes in 1 blocks are definitely lost in loss record 1 of 2
==12345==    at 0x4C2FB0F: malloc (in /usr/lib/valgrind/vgpreload_memcheck-amd64-linux.so)
==12345==    by 0x108671: main (in /path/to/your/program)

这里，40 bytes in 1 blocks are definitely lost 表明有 40 字节的内存泄漏。

解决方案：

在适当的位置添加 free(arr); 以释放内存。

#include <stdlib.h>

int main() {
    int *arr = (int*) malloc(10 * sizeof(int));
    free(arr);  // 释放内存
    return 0;
}

这样，内存泄漏问题就被解决了。

2. 野指针（Dangling Pointer）

导致情况：

释放后继续使用：指针被 free 后，再次被使用。
多次释放：同一个指针被 free 多次。
作用域问题：局部指针被返回，并在函数外部使用。

如何判断：

使用内存分析工具：如 Valgrind。
代码审查：检查所有的 free 后，是否还有对应指针的使用。
运行时错误：程序崩溃或行为不正常。

如何避免：

释放后置空：free(ptr); ptr = NULL;
不要多次释放：确保每个 free 对应一个 malloc。
谨慎返回局部指针：确保返回的指针在函数外部依然有效。

具体代码实例：

#include <stdlib.h>

int main() {
    int *arr = (int*) malloc(10 * sizeof(int));
    free(arr);  // 释放内存
    *arr = 1;  // 野指针，未定义行为
    return 0;
}

GDB调试错误信息解析：

在这种情况下，GDB 可能不会给出明确的错误信息，因为这是未定义行为。但是，如果你使用 Valgrind，你可能会看到类似以下的输出：

==12345== Invalid write of size 4
==12345==    at 0x108673: main (in /path/to/your/program)
==12345==  Address 0x51fc040 is 0 bytes inside a block of size 40 free'd

这里，Invalid write of size 4 表明有一个大小为 4 字节的无效写操作。

解决方案：

释放指针后，立即将其设置为 NULL。

#include <stdlib.h>

int main() {
    int *arr = (int*) malloc(10 * sizeof(int));
    free(arr);  // 释放内存
    arr = NULL;  // 置空指针
    return 0;
}

这样，即使再次使用该指针，也不会导致未定义行为，因为现代操作系统通常不允许对 NULL 指针进行解引用。

3. 内存碎片（Memory Fragmentation）

导致情况：

频繁小块内存分配与释放：多次分配小块内存并释放，导致内存碎片化。
长时间运行程序：程序长时间运行，内存分配和释放多次，也可能导致碎片。

如何判断：

性能下降：内存碎片会导致内存分配效率下降。
分配失败：即使有足够的总内存，也可能因为碎片过多而导致大块内存分配失败。

如何避免：

使用内存池：预先分配一大块内存，并自行管理其分配。
避免频繁分配与释放：尽量减少小块内存的频繁分配与释放。

具体代码实例：

#include <stdlib.h>

int main() {
    for (int i = 0; i < 1000000; ++i) {
        char *ptr = (char*) malloc(1);  // 分配1字节
        free(ptr);  // 立即释放
    }
    // 这样做可能会导致内存碎片
    return 0;
}

GDB调试错误信息解析：

GDB 通常不能直接检测内存碎片问题。这通常需要专门的内存分析工具或者运行时分析。

进一步优化内存池例子

在实际应用中，内存池通常需要支持内存释放操作。这通常通过维护一个空闲块链表来实现。

#include <stdlib.h>

#define POOL_SIZE 1000  // 内存池大小
char pool[POOL_SIZE];  // 内存池
char *next_free = pool;  // 下一个可用字节
char *free_list = NULL;  // 空闲块链表

// 自定义的内存分配函数
char *my_malloc(size_t size) {
    // 检查是否有可用的空闲块
    if (free_list) {
        // 如果有，返回该空闲块，并更新free_list指向下一个空闲块
        char *result = free_list;
        // 类型转换和解引用: (char **)free_list将free_list转换为指向char *的指针，然后通过*解引用它，获取这个内存块中存储的下一个空闲块的地址。
        free_list = *(char **)free_list;
        return result;
    }
    // 检查内存池中是否有足够的空间来满足这个请求
    if (next_free + size <= pool + POOL_SIZE) {
        // 如果有，分配内存并更新next_free指针
        char *result = next_free;
        next_free += size;
        return result;
    } else {
        // 如果没有足够的内存，返回NULL
        return NULL;  // 内存不足
    }
}

// 自定义的内存释放函数
void my_free(char *ptr) {
    // 将free_list（即下一个空闲块的地址）存储在ptr指向的内存块中
    *(char **)ptr = free_list;
    // 更新free_list以指向新释放的内存块
    free_list = ptr;
}





int main() {
    char *ptr1 = my_malloc(10);
    char *ptr2 = my_malloc(20);
    my_free(ptr1);
    char *ptr3 = my_malloc(10);  // 应该得到ptr1相同的地址
    // 使用 ptr2 和 ptr3
    // ...
    // 不需要释放内存，因为我们使用了内存池
    return 0;
}

代码解释

my_malloc(size_t size): 这是一个自定义的内存分配函数。

1. if (free_list): 检查free_list（空闲块列表）是否为空。
2. free_list = *(char **)free_list;: 更新free_list以指向下一个空闲块。
3. if (next_free + size <= pool + POOL_SIZE): 检查内存池是否有足够的空间来满足这个新的内存请求。
4. next_free += size;: 更新next_free指针以指向内存池中的下一个可用位置。
  my_free(char *ptr): 这是一个自定义的内存释放函数。
1. *(char **)ptr = free_list;: 将释放的内存块添加到空闲列表的前面。
2. free_list = ptr;: 更新free_list以指向新释放的内存块。
3. free_list是一个指针，用于跟踪当前可用的空闲内存块。当free_list不为NULL时，第一个if (free_list)条件满足，意味着存在至少一个空闲的内存块可以被重新分配。

在这个自定义内存管理系统中，每当调用my_free函数释放一个内存块时，这个内存块会被添加到free_list所管理的空闲内存块链表中。因此，下一次调用my_malloc时，会首先检查free_list是否为空。

如果free_list不为空（即free_list指向一个有效的内存地址），则第一个if条件满足。这时，my_malloc会从free_list中取出一个空闲的内存块，并更新free_list以指向下一个空闲的内存块（如果有的话）。
如果free_list为空（即没有可用的空闲内存块），则第一个if条件不满足，my_malloc会进入第二个if条件，尝试从内存池中分配新的内存。

使用Valgrind进行调试错误信息解析

Valgrind是一个用于内存调试、内存泄漏检测和性能分析的工具。

安装Valgrind：在Ubuntu系统中，可以使用sudo apt-get install valgrind进行安装。
运行Valgrind：valgrind ./your_program
解析输出：Valgrind会输出关于内存泄漏、非法内存访问等的信息。
例如，如果你有一个内存泄漏，Valgrind可能会输出：

==12345== 40 bytes in 1 blocks are definitely lost in loss record 1 of 2
==12345==    at 0x4C2FB0F: malloc (in /usr/lib/valgrind/vgpreload_memcheck-amd64-linux.so)
==12345==    by 0x108671: main (in /your_program)

这告诉你在哪里发生了内存泄漏，以及泄漏了多少字节。

4.未进行空指针检查

描述

在C语言编程中，未进行空指针检查是一个常见的错误。当你试图解引用一个空指针时，程序通常会崩溃。

典型代码示例

char *ptr = NULL;
*ptr = 'a';  // 未进行空指针检查，这将导致程序崩溃

GDB调试错误信息解析

在GDB（GNU调试器）中，这种错误通常会显示为“Segmentation fault”。你可以使用backtrace命令来查看崩溃发生的位置。

Valgrind工具分析

使用Valgrind运行程序，它会指出空指针解引用的具体位置，并标记为“Invalid write”。

后果

程序崩溃: 最直接的后果是程序会崩溃。
数据损坏: 在某些情况下，解引用空指针可能会导致内存损坏，从而影响程序的其他部分。
安全风险: 在某些情况下，攻击者可能利用这种漏洞执行恶意代码。

如何避免

总是检查指针是否为空: 在解引用指针之前，应该总是检查它是否为空。

   if(ptr != NULL) {
       *ptr = 'a';
   }

使用断言: 在开发阶段，使用断言来捕获空指针。

   assert(ptr != NULL);

合理初始化: 尽量避免使用未初始化的指针。

判断和诊断

代码审查: 仔细检查所有解引用操作，确保有适当的空指针检查。
静态分析工具: 使用静态代码分析工具可以帮助识别这类问题。
动态分析工具: 如Valgrind，可以在运行时捕获这类错误。

5.未初始化的内存（Uninitialized Memory）

定义

当你声明一个变量但没有给它赋值时，该变量的值是未定义的。这种情况也适用于指针。使用未初始化的内存可能导致不可预测的行为，包括程序崩溃、数据损坏或安全漏洞。

示例

int *ptr;  // 声明一个指针但没有初始化
int value = *ptr;  // 试图访问未初始化的内存

底层原理

当你声明一个指针但不初始化它时，它会指向一个随机的内存地址。这个地址可能是任何值，包括操作系统或其他程序使用的地址。

GDB调试错误信息解析

在GDB中，你可能会看到类似于“Segmentation fault”或“SIGSEGV”的错误信息，这通常意味着你试图访问一个不应该访问的内存地址。

使用Valgrind进行调试

使用Valgrind工具，你可能会看到类似于“Use of uninitialized value”的警告。

如何避免

总是初始化指针: 当你声明一个新的指针时，最好立即初始化它。

int *ptr = NULL;

使用动态内存分配函数的返回值: 当使用malloc或calloc等函数时，确保检查返回值是否为NULL。

int *ptr = malloc(sizeof(int));
if (ptr == NULL) {
    // 处理内存分配失败
}

使用Valgrind或类似工具: 在开发过程中定期使用内存检查工具。

可能的后果

程序崩溃: 最常见的后果是程序会崩溃。
数据损坏: 如果你不小心覆盖了重要数据，可能会导致数据损坏。
安全风险: 恶意用户可能会利用这种行为来攻击你的程序。
通过遵循上述最佳实践，你可以大大减少因使用未初始化的内存而导致的问题。

6.数组越界（Array Out-of-Bounds）

定义

数组越界是指在数组的有效范围之外进行访问或修改操作。这通常会导致未定义的行为，包括数据损坏、程序崩溃或安全漏洞。

示例

int arr[5];
arr[5] = 10;  // 越界访问，数组索引从0到4

底层原理

在C语言中，数组是一段连续的内存块。当你访问数组的一个元素时，实际上是在基地址上加上一个偏移量。如果这个偏移量超出了数组的大小，你就会访问到数组之外的内存。

GDB调试错误信息解析

在GDB中，你可能会看到“Segmentation fault”或其他类似的错误信息。

使用Valgrind进行调试

使用Valgrind，你可能会看到“Invalid write of size X”或“Invalid read of size X”的警告。

如何避免

检查索引范围: 在访问数组之前，总是确保索引在有效范围内。

if (index >= 0 && index < array_size) {
    // 安全访问
}

使用语言特性: 在某些现代编程语言中，有内置的数组越界检查。
使用专门的库函数: 使用已经过良好测试的库函数来操作数组。

可能的后果

程序崩溃: 访问无效的内存地址通常会导致程序崩溃。
数据损坏: 如果你不小心修改了不应该修改的内存，可能会导致数据损坏。
安全风险: 恶意用户可能会利用数组越界来执行代码或访问敏感信息。

7.悬挂指针（Dangling Pointer）

定义

悬挂指针是指向已经释放或删除的内存块的指针。访问悬挂指针通常会导致未定义的行为。

示例

char *ptr = malloc(10);
free(ptr);
// 此时ptr是悬挂指针
char ch = *ptr;  // 未定义行为

底层原理

当你释放一个指针指向的内存块后，该指针就变成了悬挂指针。操作系统可能会重新分配该内存块给其他变量或数据结构，因此通过悬挂指针访问该内存块会导致未定义的行为。

GDB调试错误信息解析

在GDB中，你可能会看到“Segmentation fault”或其他类似的错误信息。

使用Valgrind进行调试

使用Valgrind，你可能会看到“Invalid read”或“Invalid write”的警告。

如何避免

置空指针: 在释放内存后，立即将指针设置为 NULL。

free(ptr);
ptr = NULL;

局部指针: 尽量使用局部指针，这样当它们离开作用域时就会自动销毁。
避免多次释放: 确保没有在程序的其他地方释放相同的内存。

可能的后果

程序崩溃: 访问悬挂指针通常会导致程序崩溃。
数据损坏: 如果操作系统已经重新分配了该内存块，你可能会错误地修改其他数据。
安全风险: 恶意用户可能会利用这个漏洞来执行恶意代码或访问敏感信息。

注意：指针，指针解引用

当我们谈论这些操作的底层原理时，我们实际上是在讨论计算机内存和CPU如何处理这些操作。下面是更深入的解释：

1. `*ptr = NULL`

在底层，这个操作试图将NULL（通常是一个宏，值为0）存储在ptr所指向的内存地址中。这通常是不合适的，因为NULL是用于指针的，而*ptr是一个解引用操作，它期望一个与ptr相同类型的值。

底层原理: CPU会尝试将0写入ptr所指向的内存地址。这可能导致类型不匹配和未定义行为。

2. `char *ptr = NULL;`

这里，ptr是一个指针变量，其大小通常为4字节（32位系统）或8字节（64位系统）。初始化为NULL（即0）意味着这4或8字节的内存将被设置为0。

底层原理: 在堆栈或全局数据区域分配4或8字节的内存，并将其设置为0。

3. `ptr = NULL`

这个操作将现有的指针ptr设置为NULL。在底层，这意味着将ptr所在的内存设置为0。

底层原理: CPU将0写入存储ptr值的内存地址。

总结

*ptr = NULL在底层可能会导致类型不匹配和未定义行为。
char *ptr = NULL;和ptr = NULL都是将指针设置为NULL，但前者是在定义时，后者是在运行时。在底层，这两者都涉及将一段内存设置为0。
在C语言（或C++）中，指针是一个变量，它存储了另一个变量的内存地址。因此，一个指针有两个与之相关的值：
指针自身的值（Pointer’s Own Value）: 这是存储在指针变量中的值，也就是它所指向的变量的内存地址。
指针指向的内存的值（Value at the Memory Pointed to）: 这是存储在指针所指向的内存地址中的值。

指针自身的值

当你声明一个指针变量时，例如：

int *ptr;

这里，ptr是一个指针变量，它有自己的内存地址和值。这个值是它所指向的变量的内存地址。

底层****原理: 在内存（通常是堆栈）中分配了足够存储一个地址（通常是4或8字节）的空间。

指针指向的内存的值

当你通过解引用操作来访问指针指向的值时，例如：

int value = *ptr;

这里，*ptr是指针ptr指向的内存地址中存储的值。

底层原理: CPU从ptr存储的地址中读取数据，并将其存储在变量value中。

示例

int x = 10;        // 一个整数变量x，值为10
int *ptr = &x;     // 一个指针变量ptr，值为x的地址

// ptr的值是x的内存地址
// *ptr（即指针指向的内存的值）是10

在这个例子中：

ptr自身的值是变量x的内存地址。
*ptr（或指针指向的内存的值）是10，这是存储在x的内存地址中的值。

总结

理解指针自身的值和指针指向的值是理解C语言指针概念的关键。这两个值虽然相关，但它们是不同的，并存储在不同的内存位置。

weixin_38066782

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
指针&数组使用注意事项极容易引发的错误

当你声明一个变量但没有给它赋值时，该变量的值是未定义的。这种情况也适用于指针。使用未初始化的内存可能导致不可预测的行为，包括程序崩溃、数据损坏或安全漏洞。数组越界是指在数组的有效范围之外进行访问或修改操作。这通常会导致未定义的行为，包括数据损坏、程序崩溃或安全漏洞。悬挂指针是指向已经释放或删除的内存块的指针。访问悬挂指针通常会导致未定义的行为。在底层可能会导致类型不匹配和未定义行为。和ptr = NULL都是将指针设置为NULL，但前者是在定义时，后者是在运行时。在底层，这两者都涉及将一段内存设置为0。
复制链接

扫一扫