alloc流程
YUGObject *obj = [YUGObject alloc];
YUGObject *obj1 = [obj init];
YUGObject *obj2 = [obj init];
NSLog(@"%@ - %p - %p",obj, obj, &obj);
NSLog(@"%@ - %p - %p",obj1, obj1, &obj1);
NSLog(@"%@ - %p - %p",obj2, obj2, &obj2);
%@输出格式为对象 %p 输出格式为指针地址
打印结果为:
<YUGObject: 0x10068c360> - 0x10068c360 - 0x7ffeefbff520
<YUGObject: 0x10068c360> - 0x10068c360 - 0x7ffeefbff510
<YUGObject: 0x10068c360> - 0x10068c360 - 0x7ffeefbff518
探索方式
- 接入objc源码库直接调试
- Control+Step into
- 符号断点
- 菜单栏Debug->Debug Workflow->Always Show Disassembly(始终显示汇编代码)
alloc方法调用流程
alloc - _objc_rootAlloc - callAlloc - _objc_rootAllocWithZone - _class_createInstanceFromZone
源码(objc-781源码)
接下来按调用顺序看下源码
alloc
+ (id)alloc {
return _objc_rootAlloc(self);
}
_objc_rootAlloc
id _objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
callAlloc
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__
if (slowpath(checkNil && !cls)) return nil;
// No alloc/allocWithZone implementation. Go straight to the allocator.
// fixme store hasCustomAWZ in the non-meta class and
// add it to canAllocFast's summary
//hasCustomAWZ实际意义是hasCustomAllocWithZone——这里表示有没有alloc / allocWithZone的实现(只有不是继承NSObject/NSProxy的类才为true)
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
//继承自NSObject/NSProxy的类才能走到这里,在oc中基本都继承自这两个类
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
//x很可能为真, fastpath 可以简称为 真值判断
#define fastpath(x) (__builtin_expect(bool(x), 1))
//x很可能为假,slowpath 可以简称为 假值判断
#define slowpath(x) (__builtin_expect(bool(x), 0))
其中的__builtin_expect指令是由gcc引入的
- 目的:编译器可以对代码进行优化,以减少指令跳转带来的性能下降。即性能优化
- 作用:允许程序员将最有可能执行的分支告诉编译器。
- 指令的写法为:__builtin_expect(EXP, N)。表示 EXP==N的概率很大。
- fastpath定义中__builtin_expect((x),1)表示 x 的值为真的可能性更大;即 执行if 里面语句的机会更大
- slowpath定义中的__builtin_expect((x),0)表示 x 的值为假的可能性更大。即执行 else 里面语句的机会更大
在日常的开发中,也可以通过设置来优化编译器,达到性能优化的目的,设置的路径为:Build Setting --> Optimization Level --> Debug --> 将None 改为 fastest 或者 smallest
_objc_rootAllocWithZone
NEVER_INLINE
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)
{
// allocWithZone under __OBJC2__ ignores the zone parameter
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
_class_createInstanceFromZone(核心)
- cls->instanceSize:计算需要开辟的内存空间大小
- calloc:申请内存,返回地址指针
- obj->initInstanceIsa:将 类 与 isa 关联
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)
{
ASSERT(cls->isRealized());
// Read class's info bits all at once for performance
//hasCxxCtor()是判断当前class或者superclass是否有.cxx_construct 构造方法的实现
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
//hasCxxDtor()是判断判断当前class或者superclass是否有.cxx_destruct 析构方法的实现
bool hasCxxDtor = cls->hasCxxDtor();
//canAllocNonpointer()是具体标记某个类是否支持优化的isa
bool fast = cls->canAllocNonpointer();
size_t size;
//计算这个对象需要的内存大小,需要考虑到16字节内存对齐
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
// alloc 开辟内存的地方
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
//将开辟的内存地与类对象做关联
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
字节对齐
size_t instanceSize(size_t extraBytes) const {
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
//在这就定义了对象最小内存为16字节
if (size < 16) size = 16;
return size;
}
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
内存字节对齐原则
在解释为什么需要16字节对齐之前,首先需要了解内存字节对齐的原则,主要有以下三点
- 数据成员对齐规则:struct 或者 union 的数据成员,第一个数据成员放在offset为0的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如数据、结构体等)的整数倍开始(例如int在32位机中是4字节,则要从4的整数倍地址开始存储)
- 数据成员为结构体:如果一个结构里有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储(例如:struct a里面存有struct b,b里面有char、int、double等元素,则b应该从8的整数倍开始存储)
- 结构体的整体对齐规则:结构体的总大小,即sizeof的结果,必须是其内部做大成员的整数倍,不足的要补齐
总结
计算所需内存大小:cls->instanceSize
向系统申请开辟内存,返回内存地址: calloc
关联到响应的类:object_cxxConstructFromClass(obj, cls, construct_flags)
疑问:size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
flag什么时候有值的