Java 和C# 最大的不同是对底层的控制能力不同_java和c#

Java老杨

于 2024-06-24 15:05:58 发布

阅读量901

点赞数 22

文章标签： java c# 开发语言

本文链接：https://blog.csdn.net/m0_60721823/article/details/139926883

版权

var data = 1065353216;
var foo = Unsafe.AsRef(&data);
Console.WriteLine(foo.Float); // 1

[StructLayout(LayoutKind.Explicit)]
struct Foo
{
[FieldOffset(0)] public int Int;
[FieldOffset(0)] public float Float;
[FieldOffset(0)] public unsafe fixed byte Bytes[4];
}


从堆内存创建自然也没问题：

var data = new byte[] { 0, 0, 128, 63 };
fixed (void* p = data)
{
var foo = Unsafe.AsRef§;
Console.WriteLine(foo.Float); // 1
}

[StructLayout(LayoutKind.Explicit)]
struct Foo
{
[FieldOffset(0)] public int Int;
[FieldOffset(0)] public float Float;
[FieldOffset(0)] public unsafe fixed byte Bytes[4];
}



再比如，此时你面前有一个使用 C++ 编写的库，其中有这么一段代码：

#include
#include

extern “C” __declspec(dllexport)
char* __cdecl foo(char* (*gen)(int), int count) {
return gen(count);
}


然后我们编写如下 C# 代码：

[DllImport(“./foo.dll”, EntryPoint = “foo”), SuppressGCTransition]
static extern string Foo(delegate* unmanaged[Cdecl]<int, nint> gen, int count);

[UnmanagedCallersOnly(CallConvs = new[] { typeof(CallConvCdecl) }), SuppressGCTransition]
static nint Generate(int count)
{
var str = Enumerable.Repeat(“w”, count).Aggregate((a, b) => $“{a}{b}”);
return Marshal.StringToHGlobalAnsi(str);
}

var f = (delegate* unmanaged[Cdecl]<int, nint>)&Generate;
var result = Foo(f, 5);
Console.WriteLine(result); // wwwww


上面的代码干了什么事情？我们将 C# 的函数指针传到了 C++ 代码中，然后在 C++ 侧调用 C# 函数生成了一个字符串 `wwwww`，然后将这个字符串返回给 C# 侧。而就算不用函数指针换成使用委托也没有区别，因为 .NET 中的委托下面就是函数指针。


甚至，如果我们不想让 .NET 导入 `foo.dll`，我们想自行决定动态库的生命周期，还可以这么写：

var f = (delegate* unmanaged[Cdecl]<int, nint>)&Generate;
var library = NativeLibrary.Load(“./foo.dll”);
var foo = (delegate* unmanaged[Cdecl, SuppressGCTransition]<delegate* unmanaged[Cdecl]<int, nint>, int, string>)NativeLibrary.GetExport(library, “foo”);
var result = foo(f, 5);
Console.WriteLine(result); // wwwww
NativeLibrary.Free(library);


上面这些都不是 Windows 专用，在 Linux、macOS 上导入 `.so` 和 `.dylib` 都完全不在话下。



再有，我们有一些数据想要进行计算，但是我们想使用 SIMD 进行处理，那只需要这么写：

var vec1 = Vector128.Create(1.1f, 2.2f, 3.3f, 4.4f);
var vec2 = Vector128.Create(5.5f, 6.6f, 7.7f, 8.8f);

Console.WriteLine(Calc(vec1, vec2));

float Calc(Vector128 l, Vector128 r)
{
if (Avx2.IsSupported)
{
var result = Avx2.Multiply(vec1, vec2);
float sum = 0;
for (var i = 0; i < Vector128.Count; i++) sum += result.GetElement(i);
return sum;
}
else if (Rdm.IsSupported)
{
var result = Rdm.Multiply(vec1, vec2);
float sum = 0;
for (var i = 0; i < Vector128.Count; i++) sum += result.GetElement(i);
return sum;
}
else
{
float sum = 0;
for (int i = 0; i < Vector128.Count; i++)
{
sum += l.GetElement(i) * r.GetElement(i);
}
return sum;
}
}


可以看看在 X86 平台上生成了什么代码：

vzeroupper
vmovupd xmm0, [r8]
vmulps xmm0, xmm0, [r8+0x10]
vmovaps xmm1, xmm0
vxorps xmm2, xmm2, xmm2
vaddss xmm1, xmm1, xmm2
vmovshdup xmm2, xmm0
vaddss xmm1, xmm2, xmm1
vunpckhps xmm2, xmm0, xmm0
vaddss xmm1, xmm2, xmm1
vshufps xmm0, xmm0, xmm0, 0xff
vaddss xmm1, xmm0, xmm1
vmovaps xmm0, xmm1
ret


平台判断的分支会被 JIT 自动消除。但其实除了手动编写 SIMD 代码之外，前两个分支完全可以不写，而只留下：

float Calc(Vector128 l, Vector128 r)
{
float sum = 0;
for (int i = 0; i < Vector128.Count; i++)
{
sum += l.GetElement(i) * r.GetElement(i);
}
return sum;
}


因为现阶段当循环边界条件是向量长度时，.NET 会自动为我们做向量化并展开循环。



那么继续，我们还有`ref`、`in`、`out`来做引用传递。


假设我们有一个很大的 `struct`，我们为了避免传递时发生拷贝，可以直接用 `in` 来做只读引用传递：

void Test(in Foo v) { }

struct Foo
{
public long A, B, C, D, E, F, G, H, I, J, K, L, M, N;
}


而对于小的 `struct`，.NET 有专门的优化帮我们彻底消除掉内存分配，完全将 `struct` 放在寄存器中，例如如下代码：

double Test(int x1, int y1, int x2, int y2)
{
var p1 = new Point(x1, y1);
var p2 = new Point(x2, y2);
return GetDistance(p1, p2);
}

[MethodImpl(MethodImplOptions.AggressiveInlining)]
double GetDistance(Point a, Point b)
{
return Math.Sqrt((a.X - b.X) * (a.X - b.X) + (a.Y - b.Y) * (a.Y - b.Y));
}

struct Point
{
public Point(int x, int y)
{
X = x; Y = y;
}

public int X { get; set; }
public int Y { get; set; }

}


上述代码 `GetDistance` 考虑是个热点路径，因此我加 `MethodImplOptions.AggressiveInlining` 来指导 JIT 有保证地内联此函数，最后为 `Test` 生成了如下的代码：

vzeroupper
sub ecx, r8d
mov eax, ecx
imul eax, ecx
sub edx, r9d
mov ecx, edx
imul edx, ecx
add eax, edx
vxorps xmm0, xmm0, xmm0
vcvtsi2sd xmm0, xmm0, eax
vsqrtsd xmm0, xmm0, xmm0
ret


全程没有一句指令访存，非常的高效。


我们还可以借用 `ref` 的引用语义来做原地更新：

var vec = new Vector(10);
vec[2] = 5;
Console.WriteLine(vec[2]); // 5
ref var x = ref vec[3];
x = 7;
Console.WriteLine(vec[3]); // 7

class Vector
{
private int[] _array;
public Vector(int count) => _array = new int[count];
public ref int this[int index] => ref _array[index];
}


甚至还能搭配指针和手动分配内存来使用：

var vec = new Vector(10);
vec[2] = 5;
Console.WriteLine(vec[2]); // 5
ref var x = ref vec[3];
x = 7;
Console.WriteLine(vec[3]); // 7

unsafe class Vector
{
private int* _memory;
public Vector(uint count) => _memory = (int*)NativeMemory.Alloc(count, sizeof(int));
public ref int this[int index] => ref _memory[index];
~Vector() => NativeMemory.Free(_memory);
}


C# 的泛型不像 Java 采用擦除，而是真真正正会对所有的类型参数特化代码（尽管对于引用类型会共享实现采用运行时分发），这也就意味着能最大程度确保性能，并且对应的类型拥有根据类型参数大小不同而特化的内存布局。还是上面那个 `Point` 的例子，我们将下面的数据 `int` 换成泛型参数 `T`，并做值类型数字的泛型约束：

double Test1(double x1, double y1, double x2, double y2)
{
var p1 = new Point(x1, y1);
var p2 = new Point(x2, y2);
var result = GetDistanceSquare(p1, p2);
return Math.Sqrt(result);
}

double Test2(int x1, int y1, int x2, int y2)
{
var p1 = new Point(x1, y1);
var p2 = new Point(x2, y2);
var result = GetDistanceSquare(p1, p2);
return Math.Sqrt(result);
}

[MethodImpl(MethodImplOptions.AggressiveInlining)]
T GetDistanceSquare(Point a, Point b) where T : struct, IBinaryNumber
{
return (a.X - b.X) * (a.X - b.X) + (a.Y - b.Y) * (a.Y - b.Y);
}

struct Point where T : struct, IBinaryNumber
{
public Point(T x, T y)
{
X = x; Y = y;
}

public T X { get; set; }
public T Y { get; set; }

}


无论是 `Test1` 还是 `Test2`，生成的代码都非常优秀，不仅不存在任何的装箱拆箱，甚至没有任何的访存操作：

’ Test1
vzeroupper
vsubsd xmm0, xmm0, xmm2
vmovaps xmm2, xmm0
vmulsd xmm0, xmm0, xmm2
vsubsd xmm1, xmm1, xmm3
vmovaps xmm2, xmm1
vmulsd xmm1, xmm1, xmm2
vaddsd xmm0, xmm1, xmm0
vsqrtsd xmm0, xmm0, xmm0
ret

’ Test2
vzeroupper
sub ecx, r8d
mov eax, ecx
imul eax, ecx
sub edx, r9d
mov ecx, edx
imul edx, ecx
add eax, edx
vxorps xmm0, xmm0, xmm0
vcvtsi2sd xmm0, xmm0, eax
vsqrtsd xmm0, xmm0, xmm0
ret



接着讲，我们有时候为了高性能想要临时暂停 GC 的回收，只需要简单的一句：

GC.TryStartNoGCRegion(1024 * 1024 * 128);


就能告诉 GC 如果还能分配 128mb 内存那就不要做回收了，然后一段时间内以后的代码我们尽管在这个预算内分配内存，任何 GC 都不会发生。甚至还能阻止在内存不够分配的情况下进行阻塞式 Full GC：

GC.TryStartNoGCRegion(1024 * 1024 * 128, true);


代码执行完了，最后的时候调用一句：

GC.EndNoGCRegion();


即可恢复 GC 行为。


除此之外，我们还能在运行时指定 GC 的模式来最大化性能：

GCSettings.LatencyMode = GCLatencyMode.Batch;
GCSettings.LatencyMode = GCLatencyMode.Interactive;
GCSettings.LatencyMode = GCLatencyMode.LowLatency;
GCSettings.LatencyMode = GCLatencyMode.NoGCRegion;
GCSettings.LatencyMode = GCLatencyMode.SustainedLowLatency;

文末有福利领取哦~
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

👉**一、Python所有方向的学习路线**

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。![img](https://img-blog.csdnimg.cn/c67c0f87cf9343879a1278dfb067f802.png)

👉**二、Python必备开发工具**

![img](https://img-blog.csdnimg.cn/757ca3f717df4825b7d90a11cad93bc7.png)  
👉**三、Python视频合集**

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。  
![img](https://img-blog.csdnimg.cn/31066dd7f1d245159f21623d9efafa68.png)

👉 **四、实战案例**

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。**（文末领读者福利）**  
![img](https://img-blog.csdnimg.cn/e78afb3dcb8e4da3bae5b6ffb9c07ec7.png)

👉**五、Python练习题**

检查学习结果。  
![img](https://img-blog.csdnimg.cn/280da06969e54cf180f4904270636b8e.png)

👉**六、面试资料**

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。  
![img](https://img-blog.csdnimg.cn/a9d7c35e6919437a988883d84dcc5e58.png)

![img](https://img-blog.csdnimg.cn/5db8141418d544d3a8e9da4805b1a3f9.png)

👉因篇幅有限，仅展示部分资料，这份完整版的Python全套学习资料已经上传