在介绍GC前,有必要对.net中CLR管理内存区域做简要介绍:
1、 堆栈:用于分配值类型实例。堆栈主要操作系统管理,而不受垃圾收集器的控制,当值类型实例所在方法结束时,其存储单位自动释放。栈的执行效率高,但存储容量有限。
2 、GC堆:用于分配小对象实例。如果引用类型对象实例的大小小于85000字节,实例将被配置在GC堆上,当有内存分配或者回收时,垃圾收集器可能会对GC堆进行压缩。
3、 LOH:large object heap,用于分配大对象实例。如果引用类型对象的实例的大小不小于85000字节时,该实例将被分配到LOH堆上,而LOH堆不会被压缩,而且只在完全GC回收时被回收。
首先总结一下垃圾回收的几种方式:
1 内存不足溢出时,更确切的应该说是第0代对象充满时。
2 调用GC.Collect方法强制执行垃圾回收。(一般不要执行此方法)
3 Windows报告内存不足时,CLR将强制执行垃圾回收。
4 CLR卸载AppDomain时,GC将对所有代龄的对象执行垃圾回收。
5 其他情况,如物理内存不足,超出短期存活代的内存段门限,运行主机拒绝分配内存等。
什么是垃圾?一个对象成为“垃圾”表示该对象不被任何其他对象所引用。因此GC必须采用一定的算法在托管堆中遍历所有对象,最终形成一个可达对象图,而不可达的对象将成为被释放的垃圾对象等待收集。
GC如何回收垃圾?.net平台下,每个应用程序都有一组根(指针),它指向托管堆中的存储位置,由JIT编译器和CLR运行时维护根指针列表,主要包括全局变量、静态变量、局部变量和寄存器指针等。GC正是通过根指针列表来获得托管堆中的对象图,其中定义了应用程序根引用的托管堆中的对象,当GC启动时,它假设所有对象都是可回收的垃圾,开始遍历所有的根,将根引用的对象标记为可达对象添加到可达对象图中,在遍历过程中,如果根引用的对象还引用着其他对象,则该对象也被添加到可达对象图中,依次类推,GC通过根列表的递归遍历,将能找到所有可达对象,并形成一个可达对象图。同时那些不可达对象则被认为是可回收对象,GC接着运行垃圾收集进程来释放垃圾对象的内存空间。这种收集算法称为:标记和清除收集算法。
垃圾回收运行机制:
垃圾收集器将托管堆中对象分为三代:0、1和2,在CLR初始化时,会选择为三代设置不同的阙值容量,一般为:第0代大约为256KB,第1代2MB,第2代10MB。容量越大效率越低,而GC收集器会自动调节其阙值容量来提升执行效率。在CLR初始化后,首先添加到托管堆中的对象都被定位第0代对象,当有垃圾回收执行时,未被回收的对象代龄将提升一级,变成第1代对象,而后新建对象仍未第0代对象。代龄越小表示对象越新,通常情况下其生命周期也最短,因此GC总是先收集第0代的不可达对象内存。
随着对象的不断创建,垃圾收集再次启动时则只会检查0代对象并回收0代垃圾对象。而1代对象由于未达到1代容量阙值,则不会进行垃圾回收操作,从而有效地提高了垃圾收集的效率,而这也是代龄机制在垃圾回收中的性能优化作用。当第0代对象释放的内存不足以创建新的对象,同时1代对象的体积也超出了容量阙值是,垃圾收集器将同时对0代和1代对象进行垃圾回收。回收之后,未被回收的1代对象变化2级对象,未被回收的0代对象升级为1代对象,而后新建的对象仍为第0代对象。
注:微软强烈建议不要通过GC.Collect方法来强制执行垃圾收集,这样会妨碍GC本身的工作方式,通过Collect会使对象代龄不断提升,扰乱应用程序的内存使用。只有在明确知道有大量对象停止引用时,才考虑使用GC.Collect方法来调用收集器。
上面是垃圾管理器GC清理托管资源所涉及的一些机理,然而对于非托管资源,需要开发者手动清理,方法主要有:Finalize方法和Dispose方法。
Finalize:
Finalize方法又称为终止化操作:通过对自定义类型实现一个Finalize方法来释放非托管资源,而终止化操作在对象的内存回收之前通过调用Finalize方法来释放资源。在析构函数中重写Finalize方法,当垃圾管理器启动时,对于判定为可回收的垃圾对象,GC会自动执行其Finalize方法清理非托管资源。
Finalize的缺点是:
终止化操作的时间无法控制,执行顺序也不能保证。
Finalize方法会极大的损失性能,GC使用一个终止话队列的内部结构来跟踪具有Finalize方法的对象。
重写finalize方法的类型对象,其引用类型对象的代龄将被提升,带来内存压力。
Dispose:
Dispose模式的实现是:定义的类型必须实现System.IDisposable接口,该接口中定义了一个公有无参数的Dispose方法,程序设计者可以在Dispose方法中实现对非托管资源的清理工作。
总结:
在.net中,在堆栈上分配的资源在调用结束后,其内存自动会释放。
托管堆中的资源,由CLR的垃圾管理器进行清理操作。
对于非托管资源,必须由程序设计者进行操作,而对于Finalize和Dispose,最好采用Dispose方法。
关于IDispose:
开发者自定义的对象分为:普通对象(如果需要手动释放也可以实现IDispose接口),含非托管资源的非普通对象(必须实现IDispose接口且必须有析构函数)。
接口IDispose主要实现Dispose()无参函数,真正实现释放资源的是虚函数Dispose(bool disposing) ,当手动调用Dispose()时,是调用的Dispose(true),而在析构函数中调用的是Dispose(false)(防止程序员忘记手动释放)。
/// <summary>
/// 非密封类修饰用protected virtual
/// 密封类修饰用private
/// </summary>
/// <param name="disposing"></param>
protected virtual void Dispose(bool disposing)
{
if (disposed)
{
return;
}
if (disposing)//传true或false只是释放托管资源
{
// 清理托管资源
if (managedResource != null)
{
managedResource.Dispose();
managedResource = null;//指向null
}
}
// 清理非托管资源
if (nativeResource != IntPtr.Zero)
{
Marshal.FreeHGlobal(nativeResource);
nativeResource = IntPtr.Zero;//
}
//让类型知道自己已经被释放
disposed = true;
}
在.NET中每次使用new操作符创建对象时,CLR都会为该对象在堆上分配内存。对于没有继承IDisposable接口的类型对象,垃圾回收器则会直接释放对象所占用的内存:而对于实现了Dispose模式的类型,每次创建对象的时候,CLR都会将该对象的一个指针放到终结列表中,垃圾回收器在回收该对象的内存前,首先将终结列表中的指针放到一个freachable队列中。同时,CLR还会分配专门的线程读取freachable队列,并调用对象的终结器,只有这个时候对象才会真正被识别为垃圾,并且在下一次进行垃圾回收时释放对象所占的内存。
可见,实现了Dispose模式的类型对象,起码要经过两次垃圾回收才能真正地被回收掉,应为垃圾回收机制会安排CLR调用终结器。基于这个特点,如果我们的类型提供了显式释放的方法来减少一次垃圾回收,同时也可以在终结器中提供隐式清理,以避免调用者忘记调用该方法而带来的资源泄漏。
注意:有的文档中,终结器也称为析构器。析构器的叫法沿袭了C++中的称谓,因为两者形式非常接近,但两者实现机制还是不太一致,所以后来微软确定这个方法在C#中的名称为终结器。
如果调用者已经调用Dispose方法进行了显式地资源释放,那么,隐式资源释放(就是终结器)就没有必要再运行了。FCL中的类型GC提供了静态方法SuppressFinalize来通知垃圾回收器这一点。
为什么要区别对待托管资源和非托管资源呢?在这个问题前,我们首先要弄明白:托管资源需要手工清理吗?不妨将C#中的类型分为两类,一类继承了IDisposable接口,一类则没有继承。前者,暂时称为非普通类型,后者称为普通类型。非普通类型因为包含非托管资源,所以它需要继承IDisposable接口,但是,这里包含非托管资源的类型本身,它是一个托管资源。所以,托管资源中的普通类型不需要手动清理,而非普通类型是需要手工清理的(即调用Dispose方法)。
Dispose模式设计的思路是:如果调用者显式调用了Dispose方法,那么类型就应该按部就班地将自己的资源全部释放。如果调用者忘记调用Dispose方法,那么类型就假设自己的所有托管资源(哪怕是那些非普通类型)会全部都交给垃圾回收器回收,所以不进行手工清理。所以在Dispose方法中,虚方法传入参数true,在终结器中,虚方法传入参数false。
https://docs.microsoft.com/zh-cn/dotnet/standard/garbage-collection/fundamentals