C# Span & Memory

最新推荐文章于 2025-03-19 07:58:04 发布

dotNET跨平台

最新推荐文章于 2025-03-19 07:58:04 发布

阅读量563

点赞数

文章标签： c# java javascript 前端开发语言

原文链接：https://mp.weixin.qq.com/s?__biz=MzAwNTMxMzg1MA==&mid=2654097542&idx=2&sn=f378ef818f3567ea3a1383d3acada8a7&chksm=80d874d3b7affdc52081c0bb05f866193678378108a5be46ef80e6cbe5a92f3917385afbcb0e&scene=126&sessionid=0

版权

本文介绍了.NET框架中Span和Memory两种重要的数据结构，它们提供高性能内存操作，但涉及到线程安全、生命周期管理和零拷贝等特性。文章详细讲解了如何使用、优缺点及使用时的注意事项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.1Span

Span是.NET中引入的一种重要数据结构，它允许直接操作内存而无需复制数据。它指向连续内存空间，支持托管堆、原生内存和堆栈。Span是类型安全的泛型结构，提供了高性能的内存操作方式。它的引入解决了在处理大数据量时产生的性能和内存开销问题。Span可以用于数组、字符串和任何实现IReadOnlyList<T>接口的对象。

使用Span可以提高代码的性能，尤其是在需要频繁操作大数据集合时。它的内存安全性和类型安全性保证了程序的稳定性和安全性。

指向任意内存区域：Span允许表示任意内存的相邻区域，不论这些内存是与托管对象相关联的，还是通过互操作由其他运行时提供的。
值类型：Span是一个值类型，而不是引用类型，这意味着它在栈上分配，而不是在托管堆上，提高了性能。
低或零开销：Span提供了低内存开销的操作，因为它不需要复制数据，而是直接引用内存的一部分。
高性能：由于Span允许直接访问内存，它在处理大数据集时具有出色的性能，避免了额外的内存分配和复制操作。
内存和类型安全：Span提供了内存和类型安全性，避免了常见的内存错误，如越界访问。
灵活性：可以用于数组、字符串和任何实现IReadOnlyList<T>接口的对象。

Span是如何实现低或零开销的？

Span<T> 使用了指针操作和内存管理技术，使得它能够引用数组、堆栈、堆和非托管内存等不同类型的内存，而无需进行数据的复制。这样，当你需要对大量数据进行操作时，可以避免因为数据复制而产生的性能开销，从而提高程序的执行效率。

Span有哪些缺点？

线程安全性： Span 只能存放在内存栈中，因此它不具备线程安全性。在多线程环境下使用 Span 需要特别小心，需要开发者自己保证线程安全性。
局限性： Span 对象的生命周期必须在源数组或内存块的生命周期内。如果尝试访问已释放的内存，会导致程序错误。这种限制需要开发者在使用时格外留意，以避免出现悬挂引用或野指针问题。
不可变性： Span 本身是可变的，但是当 Span 引用的是一个不可变对象（例如字符串）时，由于 Span 具有修改底层数据的能力，可能会导致意外的数据变更，引发不一致性。

Span提供的常见方法

Length：获取 Span<T> 中元素的数量。
IsEmpty：检查 Span<T> 是否为空。
Slice：创建一个新的 Span<T>，表示当前 Span<T> 的子范围。
ToArray：将 Span<T> 中的元素复制到一个新的数组中。
CopyTo：将 Span<T> 中的元素复制到目标数组中的指定位置。
Equals：比较两个 Span<T> 是否相等。
SequenceEqual：比较两个 Span<T> 中的元素是否相等。
IndexOf：查找指定元素在 Span<T> 中的索引位置。
LastIndexOf：查找指定元素在 Span<T> 中的最后一个索引位置。
ToArray：将 Span<T> 中的元素复制到一个新的数组中。
Fill：将 Span<T> 中的所有元素设置为指定的值。
Slice：创建一个新的 Span<T>，表示当前 Span<T> 的子范围。
ToArray：将 Span<T> 中的元素复制到一个新的数组中。
TrimStart：删除 Span<T> 开头指定数量的元素。
TrimEnd：删除 Span<T> 结尾指定数量的元素。

使用时注意事项

了解适用场景：Span适用于需要高性能内存操作的场景，例如大数据处理、字符串操作等。在适用场景下使用Span可以避免不必要的内存分配和数据拷贝。
避免越界访问：Span不会进行边界检查，因此确保在操作过程中不会越界访问内存，否则可能导致程序崩溃或数据损坏。
避免悬垂引用：Span引用的内存块在使用过程中不能被释放，否则会导致悬垂引用问题。确保Span引用的内存在使用期间一直有效。
考虑生命周期：当使用Span引用局部变量时，确保Span的生命周期不会超过变量的生命周期，以避免引用失效。
与内存分配器协作：在需要分配新内存时，可以使用Memory来分配内存，然后将其转换为Span进行操作。这样可以保持内存的高效使用。
使用Slice操作：Span提供了Slice方法，可以创建原Span的子集，这样可以避免创建新的Span实例，提高效率。

悬垂引用（Dangling Reference）指的是在程序中，一个指针在其所指向的对象被释放（通常是通过delete或free操作）后，仍然被保留，之后被解引用，导致访问无效内存。这种情况可能引发程序崩溃、数据损坏或不可预测的行为。悬垂引用是一种常见的编程错误，需要小心避免。

代码示例

using System;

class Program
{
    static void Main()
    {
        // 模拟大量的日志数据
        string[] logData = new string[1000000];
        for (int i = 0; i < logData.Length; i++)
        {
            logData[i] = $"Log entry {i + 1}";
        }

        // 将日志数据转换为字节数组
        byte[] logBytes = new byte[logData.Length * sizeof(char)];
        for (int i = 0; i < logData.Length; i++)
        {
            Encoding.Unicode.GetBytes(logData[i], 0, logData[i].Length, logBytes, i * sizeof(char));
        }

        // 使用Span处理日志数据
        Span<byte> logSpan = new Span<byte>(logBytes);

        // 在Span中查找特定关键词
        string keyword = "error";
        byte[] keywordBytes = Encoding.Unicode.GetBytes(keyword);
        int keywordCount = 0;

        for (int i = 0; i < logSpan.Length - keywordBytes.Length; i += sizeof(char))
        {
            if (logSpan.Slice(i, keywordBytes.Length).SequenceEqual(keywordBytes))
            {
                keywordCount++;
            }
        }

        Console.WriteLine($"关键词 '{keyword}' 出现次数：{keywordCount}");
    }
}

1.2Memory

Memory<T> 是C# 7.2版本引入的一个新类型，用于在高效处理内存数据时提供更好的性能和安全性。它允许以非托管内存或托管内存数组为基础创建 Memory<T> 实例，提供了一种方便且类型安全的内存操作方式。Memory<T> 提供了一系列方法，允许读写底层数据，同时确保了内存访问的安全性和性能优势。

Memory提供的常见方法

Memory<T>.Empty 属性：获取一个表示空内存的Memory<T>实例。
Memory<T>.Length 属性：获取Memory<T>实例中元素的数量。
Memory<T>.Slice(int start, int length) 方法：返回Memory<T>实例的一个切片，从指定的 start 索引开始，长度为 length。
Memory<T>.Span 属性：获取Memory<T>实例的Span<T>表示，用于直接在内存中操作数据。
Memory<T>.ToArray() 方法：将Memory<T>实例中的元素复制到新的数组中。
Memory<T>.MarshalAsArray() 方法：将Memory<T>实例中的元素复制到新的数组中，该方法不会分配新的数组。
Memory<T>.Pin() 方法：获取一个MemoryHandle实例，用于将Memory<T>的内容固定在内存中。
Memory<T>.ToString() 方法：将Memory<T>实例的内容转换为字符串表示形式。
Memory<T>.Equals(object obj) 方法：确定当前的Memory<T>实例是否与指定的对象相等。

Memory的优缺点

优点：

高性能：Memory<T> 提供了高效的内存访问方法，适用于处理大数据量和需要高性能的场景。
安全性：它通过范围检查来避免内存越界错误，提供更安全的内存操作。
灵活性：Memory<T> 可以与 Span<T> 和数组轻松互操作，提供了更多的编程灵活性。
适用性广泛：可用于处理各种数据类型，包括基本数据类型和自定义对象。
内存管理：允许有效管理内存资源，减少不必要的内存分配和垃圾回收。

缺点：

复杂性：对于初学者来说，使用 Memory<T> 可能需要一定的学习曲线，因为它需要更多的手动内存管理。
内存泄漏风险：不正确使用 Memory<T> 可能导致内存泄漏，因为需要手动释放内存资源。
不适用于所有场景：并非所有情况都需要使用 Memory<T>，在某些简单的情况下，它可能会增加代码复杂性而不带来显著的性能提升。

使用时注意事项

了解场景：Memory<T> 适用于异步方法、类字段等高级场景，而 Span<T> 通常由底层开发者用于数据同步处理和转换。
避免多余的内存分配：在高性能应用中，避免不必要的内存分配和数据复制是关键。Memory<T> 可以帮助避免分配缓冲区和不必要的数据复制。
使用切片和子段：Memory<T> 提供了 Slice 方法，允许你创建原 Memory<T> 实例的子段。这样可以避免创建新的 Memory<T> 实例，从而节省内存和提高性能。
注意内存管理：Memory<T> 对象不负责内存的生命周期管理，确保在使用结束后适时释放相关资源，避免内存泄漏。

Memory是如何高性能处理大量数据的?

零拷贝：Memory<T> 允许在不发生数据复制的情况下直接访问内存中的数据，避免了拷贝操作的性能开销。
避免内存分配：在某些情况下，可以使用 Memory<T> 避免不必要的内存分配，提高了内存利用率和性能。
范围检查：Memory<T> 提供了范围检查，防止了内存越界错误，增强了代码的健壮性。
高性能处理大数据量：适用于需要高性能处理大量数据的场景，例如网络数据包处理、大规模数据分析等。
与Span互操作：可以与 Span<T> 类型无缝互操作，进一步提高了内存操作的灵活性和性能。

Memory是如何实现零拷贝的?

允许在计算机执行操作时，CPU 不需要先将数据从一个内存区域复制到另一个内存区域，减少了上下文切换以及CPU的拷贝时间。通过以下方式实现零拷贝：

直接内存访问（DMA）：Memory<T> 允许直接在内存中访问数据，而不需要将数据从内核态拷贝到用户态，避免了数据在内存中的多次复制。
避免上下文切换：传统IO操作中，数据需要从内核态切换到用户态，再切换回内核态进行网络传输。Memory<T> 可以在内核态直接操作数据，避免了这些切换。
内存映射（mmap）：Memory<T> 可以使用内存映射技术，将文件内容映射到内存中，使应用程序能够直接在内存中访问文件数据，而不需要将文件内容复制到应用程序的内存空间。
与其他零拷贝技术结合：Memory<T> 可以与其他零拷贝技术（如sendfile）结合使用，进一步提高了IO操作的效率，避免了数据在内存中的不必要拷贝。

代码示例

using System;

class Program
{
    static void Main()
    {
        byte[] data = new byte[1000000];

        new Random().NextBytes(data);

        Memory<byte> memory = new Memory<byte>(data);

        ProcessData(memory);

        Console.WriteLine("Data processing complete!");
    }

    static void ProcessData(Memory<byte> data)
    {
        Span<byte> span = data.Span;

        int sum = 0;
        foreach (byte value in span)
        {
            sum += value;
        }

        Console.WriteLine($"Sum of all elements: {sum}");
    }
}