.NET性能系列文章一：.NET7的性能改进

最新推荐文章于 2024-08-29 08:00:16 发布

dotNET跨平台

最新推荐文章于 2024-08-29 08:00:16 发布

阅读量728

点赞数

文章标签： java python 算法 c# 编程语言

原文链接：https://mp.weixin.qq.com/s?__biz=MzAwNTMxMzg1MA==&mid=2654094193&idx=1&sn=e08f3a6c16aed6c331ac75d79a6b92a6&chksm=80d86724b7afee326b42be61b65d6da2373eed41361c6d059b19588961d6705e00c643a4d8b1&scene=126&&sessionid=0

版权

这些方法在.NET7 中变得更快

照片来自 CHUTTERSNAP^[1] 的 Unsplash^[2]

欢迎阅读.NET 性能系列的第一章。这一系列的特点是对.NET 世界中许多不同的主题进行研究、比较性能。正如标题所说的那样，本章节在于.NET7 中的性能改进。你将看到哪种方法是实现特定功能最快的方法，以及大量的技巧和敲门，如何付出较小的代价就能最大化你代码性能。如果你对这些主题感兴趣，那请您继续关注。

.NET 7 目前（17.10.2022）处于预览阶段，将于 2022 年 11 月发布。通过这个新版本，微软提供了一些大的性能改进。这篇 .NET 性能系列的第一篇文章，是关于从.NET6 到.NET7 最值得注意的性能改进。

LINQ

最相关的改进肯定是在 LINQ 中，在.NET 7 中dotnet 社区^[3]利用 LINQ 中对数字数组的处理来使用Vector<T>(SIMD)。这大大改善了一些 LINQ 方法性能，你可以在List<int>或int[]以及其他数字集合上调用。现在 LINQ 方法也能直接访问底层数组，而不是使用枚举器访问。让我们来看看这些方法相对于.NET 6 是如何表现的。

我使用BenchmarkDotNet^[4]来比较.NET6 和.NET7 相同代码的性能。

1. Min 和 Max 方法

首先是 LINQ 方法Min()和Max()。它们被用来识别数字枚举中的最低值或最高值。新的实现特别要求有一个先前枚举的集合作为源，因此我们必须在这个基准测试中创建一个数组。

[Params(1000)]
public int Length { get; set; }

private int[] arr;

[GlobalSetup]
public void GlobalSetup() => arr = Enumerable.Range(0, Length).ToArray();

[Benchmark]
public int Min() => arr.Min();

[Benchmark]
public int Max() => arr.Max();

在.NET 6 和.NET 7 上执行这些基准，在我的机器上会得出以下结果。

方法	数组长度	平均值	比率	分配
Min	1000	3,494.08 ns	53.24	32 B
Min	1000	65.64 ns	1.00	-

Max	1000	3,025.41 ns	45.92	32 B
Max	1000	65.93 ns	1.00	-

这里非常突出的是新的.NET7 所展示的性能改进有多大。我们可以看到与.NET 6 相比，改进幅度超过 4500%。这不仅是因为在内部实现中使用了另一种类型，而且还因为不再发生额外的堆内存分配。

2. Average 和 Sum

另一个很大的改进是Average()和Sum()方法。当处理大的double集合时，这些性能优化能展现出更好的结果，这就是为什么我们要用一个double[]来测试它们。

[Params(1000)]
public int Length { get; set; }

private double[] arr;

[GlobalSetup]
public void GlobalSetup()
{
    var random = new Random();
    arr = Enumerable
        .Range(0, Length)
        .Select(_ => random.NextDouble())
        .ToArray();
}

[Benchmark]
public double Average() => arr.Average();

[Benchmark]
public double Sum() => arr.Sum();

结果显示，性能显著提高了 500%以上，而且同样没有了内存分配！

方法	数组长度	平均值	比率	分配
Average	1000	3,438.0 ns	5.50	32 B
Average	1000	630.3 ns	1.00	-

Sum	1000	3,303.8 ns	5.25	32 B
Sum	1000	629.3 ns	1.00	-

这里的性能提升并不像前面的例子那么突出，但还是非常高的!

3. Order

接下来是这是新增了两个排序方法Order()和OrderDescending()。当你不想映射到IComparable类型时，应该使用新的方法取代.NET7 中旧的OrderBy()和OrderByDescending()方法。

[Params(1000)]
public int Length { get; set; }

private double[] arr;

[GlobalSetup]
public void GlobalSetup()
{
    var random = new Random();
    arr = Enumerable
        .Range(0, Length)
        .Select(_ => random.NextDouble())
        .ToArray();
}

[Benchmark]
public double[] OrderBy() => arr.OrderBy(d => d).ToArray();

#if NET7_0
[Benchmark]
public double[] Order() => arr.Order().ToArray();
#endif

方法	数组长度	平均值	风波无
OrderBy	1000	51.13 μs	27.61 KB
Order	1000	50.82 μs	19.77 KB

在这个基准中，只使用了.NET 7，因为Order()方法在旧的运行时中不可用。

我们无法看到这两种方法之间的性能影响。然而，我们可以看到的是在堆内存分配方面有很大的改进，这将显著减少垃圾收集，从而节省一些 GC 时间。

System.IO

在.NET 7 中，Windows 下的 IO 性能有了些许改善。WriteAllText()方法不再使用那么多分配的内存，ReadAllText()方法与.NET 6 相比也快了一些。

[Benchmark]
public void WriteAllText() => File.WriteAllText(path1, content);

[Benchmark]
public string ReadAllText() => File.ReadAllText(path2);

方法	平均值	比率	分配
WriteAllText	193.50 μs	1.03	10016 B
WriteAllText	187.32 μs	1.00	464 B

ReadAllText	23.29 μs	1.08	24248 B
ReadAllText	21.53 μs	1.00	24248 B

序列化 (System.Text.Json)

来自System.Text.Json命名空间的JsonSerializer得到了一个小小的升级，一些使用了反射的自定义处理程序会在幕后为你缓存，即使你初始化一个JsonSerialzierOptions的新实例。

private JsonSerializerOptions options = new JsonSerializerOptions();
private TestClass instance = new TestClass("Test");

[Benchmark(Baseline = true)]
public string Default() => JsonSerializer.Serialize(instance);

[Benchmark]
public string CachedOptions() => JsonSerializer.Serialize(instance, options);

[Benchmark]
public string NoCachedOptions() => JsonSerializer.Serialize(instance, new JsonSerializerOptions());

public record TestClass(string Test);

在上面代码中，对NoCachedOptions()的调用通常会导致JsonSerialzierOptions的额外实例化和一些自动生成的处理程序。在.NET 7 中这些实例是被缓存的，当你在代码中使用这种方法时，你的性能会好一些。否则，无论如何都要缓存你的JsonSerialzierOptions，就像在CachedOptions例子中，你不会看到很大的提升。

方法	平均值	比率	分配	分配比率
Default	135.4 ns	1.04	208 B	3.71
CachedOptions	145.9 ns	1.12	208 B	3.71
NoCachedOptions	90,069.7 ns	691.89	7718 B	137.82
Default	130.2 ns	1.00	56 B	1.00
CachedOptions	129.8 ns	0.99	56 B	1.00
NoCachedOptions	533.8 ns	4.10	345 B	6.16

基本类型

1. Guid 相等比较

有一项改进，肯定会导致现代应用程序的性能大增，那就是对Guid相等比较的新实现。

private Guid guid0 = Guid.Parse("18a2c952-2920-4750-844b-2007cb6fd42d");
private Guid guid1 = Guid.Parse("18a2c952-2920-4750-844b-2007cb6fd42d");

[Benchmark]
public bool GuidEquals() => guid0 == guid1;

方法	运行时	平均值	比率
GuidEquals		1.808 ns	1.49
GuidEquals		1.213 ns	1.00

可以感觉到，新的实现也使用了 SIMD，比旧的实现快 30%左右。

由于有大量的 API 使用Guid作为实体的标识符，这肯定会积极的产生影响。

2. BigInt 解析

一个很大的改进发生在将巨大的数字从字符串解析为BigInteger类型。就我个人而言，在一些区块链项目中，我曾使用过BigInteger类型，在那里有必要使用这种类型来表示 ETH 代币的精度。所以在性能方面，这对我来说会很方便。

private string bigIntString = string.Concat(Enumerable.Repeat("123456789", 100000));

[Benchmark]
public BigInteger ParseBigInt() => BigInteger.Parse(bigIntString);

方法	运行时	平均值	比率	分配
ParseBigInt		2.058 s	1.62	2.09 MB
ParseBigInt		1.268 s	1.00	2.47 MB

我们可以看到性能有了明显的提高，不过我们也看到它比.NET6 上多分配一些内存。

3. Boolean 解析

对于解析boolean类型，我们也有显著的性能改进：

[Benchmark]
public bool ParseBool() => bool.TryParse("True", out _);

方法	运行时	平均值	比率
ParseBool		8.164 ns	5.21
ParseBool		1.590 ns	1.00

诊断

System.Diagnostics命名空间也进行了升级。进程处理有两个重大改进，Stopwatch有一个新功能。

1. GetProcessByName

[Benchmark]
public Process[] GetProcessByName()
      => Process.GetProcessesByName("dotnet.exe");

方法	运行时	平均值	比率	分配	分配比率
GetProcessByName		2.065 ms	1.04	529.89 KB	247.31
GetProcessByName		1.989 ms	1.00	2.14 KB	1.00

新的GetProcessByName()的速度并不明显，但使用的分配内存比前者少得多。

2. GetCurrentProcessName

[Benchmark]
public string GetCurrentProcessName()
      => Process.GetCurrentProcess().ProcessName;

方法	运行时	平均值	比率	分配	分配比率
GetCurrentProcessName		1,955.67 μs	103.02	3185 B	6.98
GetCurrentProcessName		18.98 μs	1.00	456 B	1.00

在这里，我们可以看到一个更有效的内存方法，对.NET 7 的实现有极高的性能提升。

3. Stopwatch

Stopwatch被广泛用于测量运行时的性能。到目前为止，存在的问题是，使用Stopwatch需要分配堆内存。为了解决这个问题，dotnet 社区实现了一个静态函数GetTimestamp()，它仍然需要一个复杂的逻辑来有效地获得时间差。现在又实现了另一个静态方法，名为GetElapsedTime()，在这里你可以传递之前的时间戳，并在不分配堆内存的情况下获得经过的时间。

[Benchmark(Baseline = true)]
public TimeSpan OldStopwatch()
{
    Stopwatch sw = Stopwatch.StartNew();
    return sw.Elapsed;
}

[Benchmark]
public TimeSpan NewStopwatch()
{
    long timestamp = Stopwatch.GetTimestamp();
    return Stopwatch.GetElapsedTime(timestamp);
}