【漫谈C语言和嵌入式059】C语言中的memcpy和memset：详解与源码实现

Seraphina_Lily

于 2024-09-29 10:47:23 发布

阅读量690

点赞数 21

分类专栏：漫谈C语言和嵌入式文章标签： c语言开发语言

本文链接：https://blog.csdn.net/2403_83044722/article/details/142630176

版权

漫谈C语言和嵌入式专栏收录该内容

63 篇文章 6 订阅

订阅专栏

在C语言编程中，经常需要处理内存数据的复制和初始化。标准库提供了两个非常有用的函数——memcpy用于复制内存块，memset用于设置内存块的值。本文将详细介绍这两个函数的使用方法，并探讨它们的简化版源码实现。

一、`memcpy`：内存复制

功能描述

memcpy函数的功能是从源地址复制一定数量的字节到目标地址。它适用于当源和目标没有重叠的情况下进行内存复制。如果源和目标有重叠，则应考虑使用memmove。

函数原型

void *memcpy(void *dest, const void *src, size_t n);

dest：指向目标块的指针。
src：指向源块的指针。
n：要复制的字节数。

使用示例

下面是一个简单的例子，展示如何使用memcpy来复制一个字符串：

#include <string.h>
#include <stdio.h>

int main() {
    char str1[] = "Hello, World!";
    char str2[20];

    // 复制str1到str2
    memcpy(str2, str1, sizeof(str1));
    str2[sizeof(str1)-1] = '\0'; // 确保字符串以null字符结尾
    printf("Copied string: %s\n", str2);

    return 0;
}

源码实现

接下来是一个简单的memcpy实现示例，通过循环逐字节复制数据：

#include <stddef.h> // 包含必要的头文件以获得size_t类型定义

// 定义一个函数名为my_memcpy的函数，其功能是复制内存
void* my_memcpy(void* dest, const void* src, size_t n) {
    // 将目标和源地址转换成char*类型，以便可以逐字节访问内存
    char* dest_char = (char*)dest;
    const char* src_char = (const char*)src;

    // 使用while循环逐字节复制数据
    while (n--) { // 循环n次，每次循环减少n的值
        *dest_char++ = *src_char++; // 复制一个字节，并同时更新源和目标指针
    }

    // 返回最初的目标指针
    return dest;
}

注释说明

类型转换：使用显式类型转换来确保指针能够逐字节访问内存。
循环控制：使用while循环来控制复制次数。
指针更新：在每次循环后更新指针位置，确保按顺序处理整个内存区域。

二、`memset`：内存填充

功能描述

memset函数用于将一定数量的字节设置为指定的值。这在初始化内存或清空某些结构体时非常有用。

函数原型

void *memset(void *ptr, int value, size_t num);

ptr：指向要填充的内存块的指针。
value：要设置的值。
num：设置的字节数。

使用示例

以下是一个简单的例子，展示如何使用memset来初始化一个数组：

#include <string.h>
#include <stdio.h>

int main() {
    int arr[5];

    // 初始化数组arr的所有元素为0
    memset(arr, 0, sizeof(arr));
    for(int i = 0; i < 5; i++) {
        printf("%d ", arr[i]);
    }
    printf("\n");

    return 0;
}

输出结果将会是五个零。

源码实现

下面是一个简单的memset实现示例，通过循环逐字节设置内存值：

#include <stddef.h> // 包含必要的头文件以获得size_t类型定义

// 定义一个函数名为my_memset的函数，其功能是设置内存
void* my_memset(void* ptr, int value, size_t num) {
    // 将目标指针转换成unsigned char*类型，以便可以逐字节访问内存
    unsigned char* ptr_char = (unsigned char*)ptr;

    // 将要设置的值转换为unsigned char类型
    unsigned char val = (unsigned char)value;

    // 使用while循环逐字节设置内存值
    while (num--) { // 循环num次，每次循环减少num的值
        *ptr_char++ = val; // 设置一个字节，并更新指针
    }

    // 返回最初的目标指针
    return ptr;
}

注释说明

类型转换：转换指针类型，以便可以逐字节设置内存。
值转换：确保设置的值适合逐字节存储。
循环控制：使用while循环来控制设置次数。
指针更新：每次循环更新指针位置，确保按顺序处理整个内存区域。

`memcpy`为什么使用`char*`

在memcpy的实现中，我们使用char*类型的指针来访问内存。这是因为memcpy的主要目的是逐字节地复制内存，而char类型的大小正好是一个字节。使用char*允许我们方便地遍历内存块中的每一个字节。

此外，char类型在大多数系统上都是有符号的，但这对于复制来说影响不大，因为我们只关心复制的准确性而非数值意义。char是最小的数据类型之一，因此可以方便地用来访问任何内存位置。

`memset`为什么使用`unsigned char*`

在memset的实现中，选择unsigned char*主要有几个原因：

避免溢出：当我们在设置内存时，使用unsigned char可以确保不会因为有符号数的溢出而导致意外的结果。例如，如果你试图将一个负数赋给一个有符号char，可能会得到意料之外的值。
统一处理：由于memset的任务是将内存中的每一个字节设置为一个特定的值，使用无符号类型可以确保这个值总是非负的，从而避免了不必要的符号扩展问题。
便携性：在跨平台编程中，使用unsigned char可以让代码更具有可移植性，因为无论是在大端模式还是小端模式下，unsigned char的行为都是明确且一致的。