内存内容操作函数详解[4]：memset()

byte轻骑兵

已于 2025-02-04 20:00:34 修改

阅读量3.7k

点赞数 19

分类专栏： # C语言深度解析坊文章标签： c语言开发语言

于 2024-09-03 08:55:55 首次发布

本文链接：https://blog.csdn.net/weixin_37800531/article/details/141842958

版权

C语言深度解析坊专栏收录该内容

60 篇文章

订阅专栏

c内存操作系列讲解之一：c内存内容操作之一：memcmp函数详解-CSDN博客

c内存操作系列讲解之二：c内存内容操作之二：memcpy函数详解-CSDN博客

c内存操作系列讲解之三：c内存内容操作之三：memmove函数详解-CSDN博客

5.6. 虚函数和类对象的初始化（c++）

六、示例代码

6.1. 示例 1：将字符数组（字符串）初始化为零

6.2. 示例 2：将整数数组初始化为特定值

6.3. 示例 3：将字符数组（非字符串）填充为特定字符

一、函数简介

memset 函数是 C/C++ 标准库中用于内存操作的函数之一，其主要作用是将一段内存区域的内容全部设置为指定的值。这个函数通常定义在 <string.h>（C语言）或 <cstring>（C++）头文件中。

二、函数原型

在 C 语言中，memset 函数的原型如下：

void *memset(void *s, int c, size_t n);

在 C++ 中，虽然使用方式相同，但通常会通过包含

<cstring>

头文件来访问它。

参数说明：

void *s：指向要填充的内存块的起始地址的指针。由于这是一个 void 类型的指针，因此它可以指向任何类型的数据。在实际使用中，需要将其转换为具体类型的指针，但 memset 函数内部会忽略这个类型信息，只按字节进行操作。
int c：要设置的值。尽管这个参数的类型是 int，但 memset 函数实际上只会使用该值的低8位（即一个字节）来填充内存块。意味着，无论传入什么整数，只有它的最低8位会被考虑。
size_t n：要填充的字节数。size_t 是一个无符号整数类型，用于表示对象的大小。

返回值：memset 函数返回指向 s 的指针，这个返回值使得函数可以被用在链式调用中，尽管在实际使用中这种情况并不常见。

三、函数实现（伪代码）

memset 函数的实现可以因编译器和操作系统的不同而有所差异，但基本原理是相同的：遍历指定的内存区域，并将每个字节设置为给定的值。下面是一个简单的 memset 函数的实现示例，帮忙理解其原理：

#include <stddef.h> // 包含 size_t 的定义  
  
void *my_memset(void *s, int c, size_t n) {  
    // 将 c 转换为 unsigned char，确保我们只使用它的低8位  
    unsigned char uc = (unsigned char)c;  
  
    // 将 void* 转换为 unsigned char*，以便按字节访问内存  
    unsigned char *p = (unsigned char *)s;  
  
    // 遍历内存区域并设置每个字节  
    while (n--) {  
        *p++ = uc;  
    }  
  
    // 返回原始指针  
    return s;  
}

这个实现是基础的，并且没有考虑任何优化。在实际应用中，memset 函数通常会经过高度优化，以利用处理器的特性（如 SIMD 指令集）来提高性能。

优化后的 memset 实现可能会包含以下特性：

对齐处理：检查目标内存地址是否对齐到特定的边界（如 4 字节或 8 字节对齐），并据此选择不同的填充策略。对齐的内存访问通常更快。

向量化：使用 SIMD（单指令多数据）指令集来同时填充多个字节。例如，在支持 SSE 或 AVX 指令集的 x86 处理器上，可以一次填充 16 个或更多字节。

分支预测优化：减少循环中的条件分支，以避免 CPU 的分支预测失败。

缓存优化：确保填充操作与缓存行的大小和布局相匹配，以减少缓存未命中的次数。

多线程/并行处理：在支持多核处理器的系统上，可以使用多线程来并行地填充不同的内存区域。

由于这些优化通常与具体的硬件和编译器实现紧密相关，因此很难给出一个通用的、高度优化的 memset 实现示例。不过，上面的基础实现为理解 memset 的工作原理提供了一个很好的起点。

在实际开发中，我们通常会直接使用标准库提供的 memset 函数，而不是自己实现它。标准库的实现已经过优化，可以提供最佳的性能。

四、使用场景

memset 函数在 C / C++ 编程中有着广泛的应用场景，主要用于内存内容的初始化或清除。以下是一些典型的使用场景：

4.1. 初始化内存区域

通过 malloc 或其他内存分配函数获取了一段内存区域，并且希望将其内容初始化为一个特定的值（通常是 0 或某个非零字节）时，memset 是非常有用的。有助于防止未初始化的内存被意外使用，从而导致未定义行为。

int *array = (int*)malloc(100 * sizeof(int));  
if (array != NULL) {  
    memset(array, 0, 100 * sizeof(int)); // 将数组的每个整数初始化为 0  
}

虽然在这个例子中使用了 memset 来初始化整数数组，但实际上 memset 只是将每个字节设置为 0，意味着整数数组的每个元素都会被设置为 0（假设整数是以二进制补码形式存储的）。然而，对于非零初始化或更复杂的数据类型（如结构体），需要考虑使用其他方法。

4.2. 清除内存区域

在释放内存之前，有时需要将内存区域的内容清除为 0，以防止敏感信息泄露。虽然在现代操作系统中，释放的内存通常会被清零或标记为不可访问，但在某些安全敏感的应用中，显式清零仍然是一个好习惯。

// 假设之前分配并使用了内存  
memset(array, 0, 100 * sizeof(int)); // 清除内存内容  
free(array); // 释放内存

4.3. 填充特定值

在某些情况下，可能需要将内存区域填充为某个特定的非零值。可以通过 memset 实现，但需要注意，只能填充一个字节的值。

char buffer[100];  
memset(buffer, '-', 100); // 将 buffer 的每个字节都设置为 '-'

4.4. 初始化字符数组（字符串）

虽然对于字符串来说，strcpy、strncpy 等函数更常用，但在某些情况下，想将整个字符数组（包括未用作字符串结束符的额外字节）初始化为某个特定字符。这时，memset 就很有用了。

char str[50];  
memset(str, 'A', sizeof(str) - 1); // 将前 49 个字节设置为 'A'，最后一个字节保持未定义（但通常应设置为 '\0'）  
str[sizeof(str) - 1] = '\0'; // 确保字符串以 '\0' 结尾

然而，请注意，在上面的字符串示例中，虽然 memset 填充了除最后一个字节外的所有字节，但最好还是显式地将最后一个字节设置为 '\0'，以确保字符串正确结束。

五、注意事项

在使用memset函数时，需要注意以下几个方面以确保代码的正确性和安全性。