iOS——MRC与ARC以及自动释放池深入底层学习

糸师凛

已于 2024-07-16 20:18:45 修改

阅读量433

点赞数 8

文章标签： ios 学习

于 2024-07-16 20:17:36 首次发布

本文链接：https://blog.csdn.net/m0_73348697/article/details/140475367

版权

MRC与ARC再回顾

在前面，我们简单学了MRC与ARC。MRC指手动内存管理，需要开发者使用retain、release等手动管理对象的引用计数，确保对象在必要时被释放。ARC指自动内存管理，由编译器自动管理对象的引用计数，开发者不需要手动管理内存。

哪些对象需要我们进行内存管理呢？

任何继承了NSObject的对象需要进行内存管理
而其他非对象类型(int、char、float、double、struct、enum等) 不需要进行内存管理

这是因为

继承了NSObject的对象的存储在操作系统的堆里边。而操作系统的堆一般由程序员分配释放。
非OC对象一般放在操作系统的栈里面，操作系统的栈由操作系统自动分配释放。

例：

int main(int argc, const char * argv[])
{
    @autoreleasepool {
        int a = 10; // 栈
        int b = 20; // 栈
        // Person对象(计数器==1) : 堆
        Person *p = [[Person alloc] init];
        // p（局部指针变量）: 栈
    }
    // 经过上面代码后, 栈里面的变量a、b、p 都会被回收
    // 但是堆里面的Person对象还会留在内存中,因为它是计数器依然是1
    return 0;
}

MRC深入

首先，先回顾空指针和野指针；

空指针、野指针

空指针：

空指针指的是没有指向存储空间的指针(里面存的是 nil, 也就是 0)。
给空指针发消息是没有任何反应的，也不会报错

空指针比如：

NSObject *a = [[NSObject alloc] init];   //执行完引用计数为1
[a release];   //执行完引用计数为 0，实例对象被释放。
a = nil;   //此时，a变为了空指针。
[a release];   // 再给空指针a发送消息就不会报错了。
[a release];  // 这段代码不会报错

野指针：

只要一个对象被释放了，我们就称这个对象为“僵尸对象(不能再使用的对象)”。
当一个指针指向一个僵尸对象，我们就称这个指针为「野指针」。
只要给一个野指针发送消息就会报错(EXC_BAD_ACCESS 错误)。

MRC避免循环引用

定义两个了类Person和Dog
Person类：

#import <Foundation/Foundation.h>
NS_ASSUME_NONNULL_BEGIN
@class Dog;
@interface Person : NSObject
@property (nonatomic, assign) Dog *dog;
@end

NS_ASSUME_NONNULL_END

Dog类：

#import <Foundation/Foundation.h>
NS_ASSUME_NONNULL_BEGIN
@class Person;
@interface Dog : NSObject
@property (nonatomic, retain) Person *person;
@end

NS_ASSUME_NONNULL_END

主函数：

Person *p = [[Person alloc] init];
Dog *d = [[Dog alloc] init];
        
p.dog = d;
d.person = p;
        
[p release];
[d release];

我们看上面的代码，会出现 A 对象要拥有 B 对象，而 B 对应又要拥有 A 对象，此时会形成循环 retain，导致 A 对象和 B 对象永远无法释放。

要解决这个问题的话：不要让 A retain B，B retain A，所以其中一方不要做retain方法。当两端互相引用时，应该一端用 retain，一端用 assign。

ARC深入

在之前的博客里，已经学习了ARC许多知识，包括修饰符、规则、属性和简单实现。可以看我的博客：iOS——【自动引用计数】ARC规则及实现
现在我们更深入的了解它的实现。

在Objective C中，有三种类型是ARC适用的：
1. block
2. objective 对象，id, Class, NSError*等
3. 由attribute((NSObject))标记的类型。

*像double ,CFStringRef等不是ARC适用的，仍然需要手动管理内存。
Tips：以CF开头的（Core Foundation）的对象往往需要手动管理内存。

ARC在编译期和运行期分别做了什么？

先说结论：

1. 在编译期，ARC会把互相抵消的retain、release、autorelease操作约简。
2. ARC包含有运行期组件，可以在运行期检测到autorelease和retain这一对多余的操作。为了优化代码，在方法中返回自动释放的对象时，要执行一个特殊函数。

接下来我们来探究这个结论：

ARC的实现

ARC的底层是怎么工作的

首先根据前面的学习，我们知道，ARC有一套命名规则：若方法名以alloc、new、copy、mutableCopy开头，则方法的调用者需要负责保留和释放使用该方法返回的对象，在MRC中，就需要我们手动保留和释放返回的对象。如果不以上面这些开头，则不用调用者保留和释放，因为方法内部会自动执行autorelease方法。

下面用实例说明：
实例1
首先，我们创建一个Person类，这个类有两个类方法，一个是用creat开头的，一个是用new开头的，现在调用这两个方法：

#import "Person.h"

@implementation Person

+ (instancetype)creatPerson {
    return [[self alloc] init];
}
+ (instancetype)newPerson {
    return [[self alloc] init];
}

@end

#import <Foundation/Foundation.h>
#import "Person.h"

int main(int argc, const char * argv[]) {
    [Person creatPerson];
    [Person newPerson];
}

接下来我们查看它的汇编代码：
在这里插入图片描述

可以看见，在newPerson方法下，首先用objc_megSend向newPerson发送消息，然后有一个objc_release的标志位，这个标志位意味着系统在这个位置会调用objc_release函数。
而在creatPerson方法下，creatPerson中ARC修改后的代码大致逻辑是：

//Person.m
+ (instancetype)creatPerson {
    id temp = [self new];  
    return objc_autoreleaseReturnValue(temp); 
} 
//main.m
- (void)testForARC { 
    objc_unsafeClaimAutoreleasedReturnValue([Person creatPerson]); 
}

在create中多了objc_autoreleaseReturnValue，这是因为ARC规则，无需手动释放的内部自动autorelease。
objc_autoreleaseReturnValue: 这个函数的作用相当于代替我们手动调用 autorelease, 创建了一个autorelease对象。编译器会检测之后的代码, 根据返回的对象是否执行 retain操作, 来设置全局数据结构中的一个标志位, 来决定是否会执行 autorelease操作。该标记有两个状态, ReturnAtPlus0代表执行 autorelease, 以及ReturnAtPlus1代表不执行 autorelease。
objc_unsafeClaimAutoreleasedReturnValue函数作用是对autorelease对象不做处理仅仅返回，对非autorelease对象调用objc_release函数并返回。所以本情景中它创建时执行了 autorelease操作了，就不会对其进行 release操作了。只是返回了对象，在合适的实际autoreleasepool会对其进行释放的。

实例2
我们再给出下面的例子：

id temp2 = [Person newPerson];

查看汇编代码：
在这里插入图片描述

可以看出来，与前面不同的是多了一个objc_storeStrong的标志位。因此可知，编译器在这里调用了该函数。我们在objc库里看看这个函数的实现。在objc4的NSObject.mm中：

void
objc_storeStrong(id *location, id obj)
{
    id prev = *location;
    if (obj == prev) {
        return;
    }
    objc_retain(obj);
    *location = obj;
    objc_release(prev);
}

说一下这个函数：objc_storeStrong函数是用于管理强引用的一个函数，主要用于更新一个指向对象的强引用，并确保正确的内存管理。
在上面这段代码里：首先获取旧对象的引用（prev）。然后进行比较，如果新对象和旧对象相同，则返回。否则，保留新对象，并将新对象的引用+1。然后更新指针*location，指向新对象。最后释放旧对象。使用这个函数是因为：temp2是一个强引用变量。编译器会将上述代码转换为类似以下内容：

id newObject = [Person newPerson];
objc_storeStrong(&temp2, newObject);

而同样的，在creatPerson方法中：

id temp1 = [Person creatPerson];

它的汇编代码：
在这里插入图片描述

这里同样使用了objc_storeStrong函数，但是多了一个objc_retainAutoreleasedReturnValue函数，这个函数将替代 MRC中的 retain方法, 此函数也会检测刚才提到的那个标志位, 如果为ReturnAtPlus0执行该对象的 retain操作，否则直接返回对象本身。

在这个例子中, 由于代码中没有对对象进行保留, 所以创建时objc_autoreleaseReturnValue函数设置的标志位状态是应该是ReturnAtPlus0。所以, 该函数在此处是会进行 retain操作的。
实例3
有如下代码：

#import "strat.h"
#import "Person.h"

@interface strat ()

@property (nonatomic, strong) id temp1;
@property (nonatomic, strong) id temp2;

@end

@implementation strat

- (void)gogo {
    self.temp1 = [Person creatPerson];
    self.temp2 = [Person newPerson];
}

@end

我们先看temp2的汇编代码：
在这里插入图片描述

可以看出，这段代码相比于实例2的代码，多了一个megSend：objc_msgSend$setTemp2，这个是setter方法的函数，所以其实这里相当于多了一个setter操作。因此这里ARC的补充的代码大概是：

- (void)setTemp2:(id)newValue {
    objc_storeStrong(&_temp2, newValue);
}

temp1与temp2被补充的部分差不多。

自动释放池

自动释放池（autorelease）是 Objective-C 内存管理的重要特性之一。
简单来说它允许开发者推迟对象的释放时间，通常在下一个事件循环中才执行释放操作。
自动释放池之前在博客中学习过，现在来深入学习一下。

MRC下的自动释放池

在MRC下使用自动释放池是通过NSAutoreleasePool实现的（如果编译器版本是LLVM.3.0以上，那么@autorelease{…}也可以使用），其生命周期相当于c语言变量的作用域。对于所有调用过 autorelease方法的对象，在废弃 NSAutoreleasePool对象时，都将调用 release实例方法。

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        //创建并使pool持有一个自动释放池
        NSAutoreleasePool *pool = [[NSAutoreleasePool alloc] init];
        //创建Person实例对象p
        Person *p = [[Person alloc] init];
        //将实例对象p加入pool持有的自动释放池
        [p autorelease];
        //废弃NSAutoreleasePool对象;
        //并向pool池中的所有对象发送消息，让它们调用release方法。这里相当于也[p release]了
        [pool drain];
        
        //这里会报错，因为p已被释放
        NSLog(@"%@", p);
    }
    return 0;
}

报错内容：Thread 1: EXC_BAD_ACCESS (code=1, address=0x370001a2b46808)

这里我当时有一个问题：当调用[p autorelease]的时候，是怎么判断当前的自动释放池是pool持有的那个的？
这是因为：运行时系统维护了一个全局的栈来跟踪所有的自动释放池。当一个新的 NSAutoreleasePool 对象被创建时，它会被推入栈顶。随后，当调用 -autorelease 方法时，当前的栈顶的自动释放池会接收该对象。

理解 NSAutoreleasePool对象的生命周期，如下图所示：
在这里插入图片描述

ARC下使用自动释放池

ARC环境不能使用 NSAutoreleasePool类也不能调用autorelease方法，代替它们实现对象自动释放的是 @autoreleasepool块和__autoreleasing修饰符。比较两种环境下的代码差异如下图：
在这里插入图片描述

ARC环境下使用自动释放池：

@autoreleasepool {
    id obj = [[NSObject alloc] init];
    NSLog(@"%@", obj); 
}

ARC的很多情况下，即使是不显式的使用 __autoreleasing，也能实现对象被注册到释放池中。主要包括以下几种情况：

编译器会进行优化，检查方法名是否以 alloc/new/copy/mutableCopy开始，如果不是则自动将返回对象注册到 Autoreleasepool;
访问附有 __weak修饰符的变量时，实际上必定要访问注册到 Autoreleasepool的对象，即会自动加入 Autoreleasepool;
id的指针或对象的指针(id*，NSError **)，在没有显式地指定修饰符时候，会被默认附加上 __autoreleasing修饰符，加入 Autoreleasepool。

AutoreleasePool的具体实现

有以下自动释放池的代码：

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSLog(@"hello");
    }
    return 0;
}

将其转化为cpp代码：

int main(int argc, const char * argv[]) {
    /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool; 
        NSLog((NSString *)&__NSConstantStringImpl__var_folders_mr_nr_xs_2x079d0zxp68ymmm4c0000gn_T_main_82a790_mi_0);
    }
    return 0;
}

可以发现，自动释放池在底层中对应的是一个__AtAutoreleasePool的结构体，我们再在源码中可以找到这个结构体的定义：

extern "C" __declspec(dllimport) void * objc_autoreleasePoolPush(void);
extern "C" __declspec(dllimport) void objc_autoreleasePoolPop(void *);

struct __AtAutoreleasePool {
  __AtAutoreleasePool() {
    atautoreleasepoolobj = objc_autoreleasePoolPush();
    }
  ~__AtAutoreleasePool() {
    objc_autoreleasePoolPop(atautoreleasepoolobj);
    }
  // 边界对象(指针)，用来标识自动释放池的开始和结束。这个对象在创建和销毁自动释放池时分别被推入和弹出。
  void * atautoreleasepoolobj;
};

可以看见，在这个结构体中有一个构造函数内部调用objc_autoreleasePoolPush()，和一个析构函数内部调用objc_autoreleasePoolPop(atautoreleasepoolobj)，以及一个atautoreleasepoolobj边界对象。

objc_autoreleasePoolPush()用于返回边界对象
objc_autoreleasePoolPop(atautoreleasepoolobj)用于传入边界对象

边界对象其实就是 nil的别名，而它的作用事实上也就是为了起到一个标识的作用。

AutoreleasePoolPage

我们继续深入对objc_autoreleasePoolPush()和objc_autoreleasePoolPop(atautoreleasepoolobj)进行学习，发现它们实际上是对AutoreleasePoolPage对应的静态方法 push和 pop的封装。
在NSObject的源码中可以发现以下代码：

void *
objc_autoreleasePoolPush(void)
{
    return AutoreleasePoolPage::push();
}

NEVER_INLINE
void
objc_autoreleasePoolPop(void *ctxt)
{
    AutoreleasePoolPage::pop(ctxt);
}

AutoreleasePoolPage是C++的一个类，在NSObject.mm中可以找到它的代码，这是它的一部分核心代码：

class AutoreleasePoolPage {
#   define EMPTY_POOL_PLACEHOLDER ((id*)1)  //空池占位
#   define POOL_BOUNDARY nil                //边界对象(即哨兵对象）
    static pthread_key_t const key = AUTORELEASE_POOL_KEY;
    static uint8_t const SCRIBBLE = 0xA3;  // 0xA3A3A3A3 after releasing
    static size_t const SIZE = 
#if PROTECT_AUTORELEASEPOOL
        PAGE_MAX_SIZE;  // must be multiple of vm page size
#else
        PAGE_MAX_SIZE;  // size and alignment, power of 2
#endif
    static size_t const COUNT = SIZE / sizeof(id);
    magic_t const magic;                  //校验AutoreleasePagePoolPage结构是否完整
    id *next;                             //指向新加入的autorelease对象的下一个位置，初始化时指向begin()
    pthread_t const thread;               //当前所在线程，AutoreleasePool是和线程一一对应的
    AutoreleasePoolPage * const parent;   //指向父节点page，第一个结点的parent值为nil
    AutoreleasePoolPage *child;           //指向子节点page，最后一个结点的child值为nil
    uint32_t const depth;                 //链表深度，节点个数
    uint32_t hiwat;                       //数据容纳的一个上限
    //......
};

每个自动释放池都是是由若干个 AutoreleasePoolPage组成的双向链表结构，如下图所示:
在这里插入图片描述

AutoreleasePoolPage中拥有 parent和 child指针，分别指向上一个和下一个 page；当前一个 page的空间被占满(每个 AutorelePoolPage的大小为4096字节)时，就会新建一个 AutorelePoolPage对象并连接到链表中，后来的 Autorelease对象也会添加到新的 page中；

另外，当 next==begin()时，表示 AutoreleasePoolPage为空；
当 next ==end()，表示 AutoreleasePoolPage已满。

AutoreleasePool子线程上的释放时机

子线程默认不开启 RunLoop，那么其中的延时对象该如何释放呢？其实这依然要从 Thread和 AutoreleasePool的关系来考虑：

Each thread (including the main thread) maintains its own stack of NSAutoreleasePool objects.

也就是说，每一个线程都会维护自己的 Autoreleasepool栈，所以子线程虽然默认没有开启 RunLoop，但是依然存在 AutoreleasePool，在子线程退出的时候会去释放 autorelease对象。
前面讲到过，ARC会根据一些情况进行优化，添加 __autoreleasing修饰符，其实这就相当于对需要延时释放的对象调用了 autorelease方法。从源码分析的角度来看，如果子线程中没有创建 AutoreleasePool ，而一旦产生了 Autorelease对象，就会调用 autoreleaseNoPage方法自动创建 hotpage，并将对象加入到其栈中。所以，一般情况下，子线程中即使我们不手动添加自动释放池，也不会产生内存泄漏。

weak修饰符补充

在前面的博客中，我们知道了weak指针的一个生命周期是objc_initWeak函数到objc_destroyWeak函数，但其实这两个函数中都引用了另一个runtime的函数storeWeak，这个函数和我们刚刚见到的storeStrong函数是对应的，现在我们到NSObject.mm中看看他们的源码：

id
objc_initWeak(id *location, id newObj)
{
    if (!newObj) {
        *location = nil;
        return nil;
    }

    return storeWeak<DontHaveOld, DoHaveNew, DoCrashIfDeallocating>
        (location, (objc_object*)newObj);
}

void
objc_destroyWeak(id *location)
{
    (void)storeWeak<DoHaveOld, DontHaveNew, DontCrashIfDeallocating>
        (location, nil);
}

storeWeak:

static id 
storeWeak(id *location, objc_object *newObj)
{
    ASSERT(haveOld  ||  haveNew); // 断言必须有旧值或新值
    if (!haveNew) ASSERT(newObj == nil); // 如果没有新值，断言新对象为 nil

    Class previouslyInitializedClass = nil; // 之前初始化的类
    id oldObj; // 旧对象
    SideTable *oldTable; // 旧对象的 SideTable
    SideTable *newTable; // 新对象的 SideTable

    // 获取旧值和新值的锁。按锁地址排序以防止锁排序问题。
    // 如果旧值在操作过程中发生变化，重试。
 retry:
    if (haveOld) {
        oldObj = *location; // 获取旧对象
        oldTable = &SideTables()[oldObj]; // 获取旧对象的 SideTable
    } else {
        oldTable = nil; // 没有旧值
    }
    if (haveNew) {
        newTable = &SideTables()[newObj]; // 获取新对象的 SideTable
    } else {
        newTable = nil; // 没有新值
    }

    SideTable::lockTwo<haveOld, haveNew>(oldTable, newTable); // 获取旧值和新值的锁

    if (haveOld  &&  *location != oldObj) {
        SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable); // 如果旧值在操作过程中发生变化，解锁并重试
        goto retry;
    }

    // 为了防止弱引用机制与 +initialize 机制之间的死锁，确保没有弱引用的对象具有未初始化的 isa。
    if (haveNew  &&  newObj) {
        Class cls = newObj->getIsa(); // 获取新对象的类
        if (cls != previouslyInitializedClass  &&  
            !((objc_class *)cls)->isInitialized()) // 如果类未初始化
        {
            SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable); // 解锁
            class_initialize(cls, (id)newObj); // 初始化类

            previouslyInitializedClass = cls; // 更新之前初始化的类

            goto retry; // 重试
        }
    }

    // 清理旧值（如果有）。
    if (haveOld) {
        weak_unregister_no_lock(&oldTable->weak_table, oldObj, location); // 从弱引用表中解除登记旧对象
    }

    // 登记新值（如果有）。
    if (haveNew) {
        newObj = (objc_object *)
            weak_register_no_lock(&newTable->weak_table, (id)newObj, location, 
                                  crashIfDeallocating ? CrashIfDeallocating : ReturnNilIfDeallocating); // 在弱引用表中登记新对象
        // weak_register_no_lock 如果弱存储应被拒绝，则返回 nil

        // 在引用计数表中设置 is-weakly-referenced 位。
        if (!_objc_isTaggedPointerOrNil(newObj)) {
            newObj->setWeaklyReferenced_nolock(); // 设置新对象为弱引用
        }

        // 不要在其他地方设置 *location。这会引入竞争条件。
        *location = (id)newObj; // 更新位置指针为新对象
    }
    else {
        // 没有新值。存储没有变化。
    }
    
    SideTable::unlockTwo<haveOld, haveNew>(oldTable, newTable); // 解锁旧值和新值的 SideTable

    // 这个操作必须在解锁后调用，因为它可能会调用任意代码。
    // 特别是，即使 _setWeaklyReferenced 没有实现，resolveInstanceMethod: 可能实现，并可能回调到弱引用机制。
    callSetWeaklyReferenced((id)newObj); // 调用设置弱引用的方法

    return (id)newObj; // 返回新对象
}

这段代码的主要思路是管理弱引用对象，首先获取旧对象和新对象并锁定相关表以防止多线程冲突，接着检查并确保新对象的类已初始化，然后从弱引用表中解除旧对象的登记，再将新对象登记到弱引用表并设置弱引用标志，最后解锁并调用设置弱引用的方法，从而安全地更新和管理弱引用对象。

弱引用表是Objective-C中用来管理和追踪弱引用对象的数据结构。在Objective-C的内存管理中，弱引用是一种不会增加对象引用计数的引用类型，这意味着当对象没有强引用时，弱引用不会阻止对象被释放。
弱引用表的主要作用包括三个方面：首先，它能够跟踪记录被弱引用的对象，并存储这些弱引用的位置；其次，当对象的所有强引用都被释放后，系统会自动将这些对象从弱引用表中移除，并将弱引用设置为nil，从而防止悬挂指针问题的发生；最后，通过弱引用表，可以有效地防止因循环引用而导致的内存泄漏，因为弱引用不会增加对象的引用计数，也不会导致对象无法释放。

ARC不会优化的场景。

ARC适用于绝大多数场景，但并不是万能的，例如performSelect系列有许多方法，带有选择子，编译器不知道选择子具体是什么，必须到了运行期才能确定，因此在编译时，不知道其方法名，没法利用ARC内存规则来判断是否释放。

如果这时我们使用selector（newTest）就会造成内存泄漏，因为ARC此时不会帮助我们添加release。

糸师凛

关注

8
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
iOS——MRC与ARC以及自动释放池深入底层学习

在前面，我们简单学了MRC与ARC。MRC指手动内存管理，需要开发者使用retainrelease等手动管理对象的引用计数，确保对象在必要时被释放。ARC指自动内存管理，由编译器自动管理对象的引用计数，开发者不需要手动管理内存。这是因为。
复制链接

扫一扫