iOS中malloc和calloc源码分析

最新推荐文章于 2024-05-03 12:06:54 发布

_祀梦

最新推荐文章于 2024-05-03 12:06:54 发布

阅读量567

点赞数

分类专栏： OC底层原理文章标签： ios objective-c 开发语言

本文链接：https://blog.csdn.net/qq_42376419/article/details/128226480

版权

OC底层原理专栏收录该内容

7 篇文章 0 订阅

订阅专栏

iOS中malloc和calloc源码分析

iOS中malloc和calloc源码分析

calloc

我们知道在iOS创建对象的alloc方法中，最终通过调用calloc方法来开辟内存。如果这里具体流程不够清楚的话，可以参考Runtime源码分析-alloc
那么calloc具体是如何实现的呢？由于在objc4中没有提供该方法，我们通过libmalloc-317.40.8代码去研究。

1. calloc

首先进入calloc方法

void *
calloc(size_t num_items, size_t size)
{
	return _malloc_zone_calloc(default_zone, num_items, size, MZ_POSIX);
}

内部调用了_malloc_zone_calloc()方法

2. _malloc_zone_calloc

MALLOC_NOINLINE
static void *
_malloc_zone_calloc(malloc_zone_t *zone, size_t num_items, size_t size,
		malloc_zone_options_t mzo)
{
	MALLOC_TRACE(TRACE_calloc | DBG_FUNC_START, (uintptr_t)zone, num_items, size, 0);

	void *ptr;
	if (malloc_check_start) {
		internal_check();
	}
    // ptr指针指向一块内存
	ptr = zone->calloc(zone, num_items, size);

	if (os_unlikely(malloc_logger)) {
		malloc_logger(MALLOC_LOG_TYPE_ALLOCATE | MALLOC_LOG_TYPE_HAS_ZONE | MALLOC_LOG_TYPE_CLEARED, (uintptr_t)zone,
				(uintptr_t)(num_items * size), 0, (uintptr_t)ptr, 0);
	}

	MALLOC_TRACE(TRACE_calloc | DBG_FUNC_END, (uintptr_t)zone, num_items, size, (uintptr_t)ptr);
	if (os_unlikely(ptr == NULL)) {
		malloc_set_errno_fast(mzo, ENOMEM);
	}
	return ptr;
}

该方法中最终返回结果是一个指针，所以最重要的是13行。它创建了一块内存，并让ptr指向它。
这个时候，我们点击zone->calloc跳转对应的实现，发现点不进去。这个时候才用汇编方式，看到该方法最终跳转至default_zone_calloc方法

3. default_zone_calloc

static void *
default_zone_calloc(malloc_zone_t *zone, size_t num_items, size_t size)
{
	zone = runtime_default_zone();
	
	return zone->calloc(zone, num_items, size);
}

该方法内部调用 zone->calloc方法，仍然点不进去。再次使用汇编方法，发现该方法跳转至nano_calloc

4. nano_calloc

static void *
nano_calloc(nanozone_t *nanozone, size_t num_items, size_t size)
{
	size_t total_bytes;

	if (calloc_get_size(num_items, size, 0, &total_bytes)) {
		return NULL;
	}

	if (total_bytes <= NANO_MAX_SIZE) {
		void *p = _nano_malloc_check_clear(nanozone, total_bytes, 1);
		if (p) {
			return p;
		} else {
			/* FALLTHROUGH to helper zone */
		}
	}
	malloc_zone_t *zone = (malloc_zone_t *)(nanozone->helper_zone);
	return zone->calloc(zone, 1, total_bytes);
}

此处我们还是先看返回值，发现有三处返回。第一处直接返回NULL，这肯定不是我们需要的答案，直接忽略。剩下两处，无法确定。这个时候通过断点调试，发现一般情况走的是_nano_malloc_check_clear方法

5. _nano_malloc_check_clear

static void *
_nano_malloc_check_clear(nanozone_t *nanozone, size_t size, boolean_t cleared_requested)
{
	MALLOC_TRACE(TRACE_nano_malloc, (uintptr_t)nanozone, size, cleared_requested, 0);

	void *ptr;
	size_t slot_key;
    // 1. 计算合适的内存大小
	size_t slot_bytes = segregated_size_to_fit(nanozone, size, &slot_key); // Note slot_key is set here
	mag_index_t mag_index = nano_mag_index(nanozone);

	nano_meta_admin_t pMeta = &(nanozone->meta_data[mag_index][slot_key]);

    // 2. 开辟一片内存，并让ptr指针指向这块内存
	ptr = OSAtomicDequeue(&(pMeta->slot_LIFO), offsetof(struct chained_block_s, next));
	if (ptr) {
		unsigned debug_flags = nanozone->debug_flags;
#if NANO_FREE_DEQUEUE_DILIGENCE
		size_t gotSize;
		nano_blk_addr_t p; // the compiler holds this in a register

		p.addr = (uint64_t)ptr; // Begin the dissection of ptr
		if (NANOZONE_SIGNATURE != p.fields.nano_signature) {
			malloc_zone_error(debug_flags, true,
					"Invalid signature for pointer %p dequeued from free list\n",
					ptr);
		}

		if (mag_index != p.fields.nano_mag_index) {
			malloc_zone_error(debug_flags, true,
					"Mismatched magazine for pointer %p dequeued from free list\n",
					ptr);
		}

		gotSize = _nano_vet_and_size_of_free(nanozone, ptr);
		if (0 == gotSize) {
			malloc_zone_error(debug_flags, true,
					"Invalid pointer %p dequeued from free list\n", ptr);
		}
		if (gotSize != slot_bytes) {
			malloc_zone_error(debug_flags, true,
					"Mismatched size for pointer %p dequeued from free list\n",
					ptr);
		}

		if (!_nano_block_has_canary_value(nanozone, ptr)) {
			malloc_zone_error(debug_flags, true,
					"Heap corruption detected, free list canary is damaged for %p\n"
					"*** Incorrect guard value: %lu\n", ptr,
					((chained_block_t)ptr)->double_free_guard);
		}

#if defined(DEBUG)
		void *next = (void *)(((chained_block_t)ptr)->next);
		if (next) {
			p.addr = (uint64_t)next; // Begin the dissection of next
			if (NANOZONE_SIGNATURE != p.fields.nano_signature) {
				malloc_zone_error(debug_flags, true,
						"Invalid next signature for pointer %p dequeued from free "
						"list, next = %p\n", ptr, "next");
			}

			if (mag_index != p.fields.nano_mag_index) {
				malloc_zone_error(debug_flags, true,
						"Mismatched next magazine for pointer %p dequeued from "
						"free list, next = %p\n", ptr, next);
			}

			gotSize = _nano_vet_and_size_of_free(nanozone, next);
			if (0 == gotSize) {
				malloc_zone_error(debug_flags, true,
						"Invalid next for pointer %p dequeued from free list, "
						"next = %p\n", ptr, next);
			}
			if (gotSize != slot_bytes) {
				malloc_zone_error(debug_flags, true,
						"Mismatched next size for pointer %p dequeued from free "
						"list, next = %p\n", ptr, next);
			}
		}
#endif /* DEBUG */
#endif /* NANO_FREE_DEQUEUE_DILIGENCE */

		((chained_block_t)ptr)->double_free_guard = 0;
		((chained_block_t)ptr)->next = NULL; // clear out next pointer to protect free list
	} else {
        // 如果ptr指针为空，则去去找下一块合适内存
		ptr = segregated_next_block(nanozone, pMeta, slot_bytes, mag_index);
	}
	
    // 3. 是否给内存进行初始化
	if (cleared_requested && ptr) {
		memset(ptr, 0, slot_bytes); // TODO: Needs a memory barrier after memset to ensure zeroes land first?
	}
	return ptr;
}

该方法中，它主要干了三件事：
1. segregated_size_to_fit：计算需要开辟的内存大小
2. OSAtomicDequeue或者segregated_next_block：开辟内存
3. memset(ptr, 0, slot_bytes);：是否进行初始化

segregated_size_to_fit

static MALLOC_INLINE size_t
segregated_size_to_fit(nanozone_t *nanozone, size_t size, size_t *pKey)
{
	size_t k, slot_bytes;

	if (0 == size) {
		size = NANO_REGIME_QUANTA_SIZE; // Historical behavior
	}
    // 内存按照16字节对齐
    // k = (size + 16 - 1) >> 4 右移4位
	k = (size + NANO_REGIME_QUANTA_SIZE - 1) >> SHIFT_NANO_QUANTUM; // round up and shift for number of quanta
    // slot_bytes = k << 4 左移4位
	slot_bytes = k << SHIFT_NANO_QUANTUM;							// multiply by power of two quanta size
	*pKey = k - 1;													// Zero-based!

	return slot_bytes;
}

这里主要是内存对齐算法，算法流程是：
1. 当前size + 15，左移4位
2. 再把上面的值，右移4位
具体计算过程如下：假设size为8字节
1. (size + NANO_REGIME_QUANTA_SIZE - 1) = 8 + 15 = 23，用二进制表示：0001 0111
2. k >> SHIFT_NANO_QUANTUM，用二进制表示：0000 0001
3. k << SHIFT_NANO_QUANTUM，用二进制表示：0001 0000
4. 最终结果是16字节，实现了按照16字节对齐。

OSAtomicDequeue或者segregated_next_block

首先会通过OSAtomicDequeue方法来开辟内存
- 如果开辟成功，则返回内存首地址给ptr。然后对ptr进行一系列的验证
- 如果开辟失败，则通过segregated_next_block方法进行再次尝试开辟

static MALLOC_INLINE void *
segregated_next_block(nanozone_t *nanozone, nano_meta_admin_t pMeta, size_t slot_bytes, unsigned int mag_index)
{
	while (1) {
        // 当前这块pMeta可用内存结束地址
		uintptr_t theLimit = pMeta->slot_limit_addr; // Capture the slot limit that bounds slot_bump_addr right now
		uintptr_t b = OSAtomicAdd64Barrier(slot_bytes, (volatile int64_t *)&(pMeta->slot_bump_addr));
        // 减去添加的偏移量，获取当前可以获取的地址
		b -= slot_bytes; 

		if (b < theLimit) {   // Did we stay within the bound of the present slot allocation?
            // 如果地址还在范围之内，则返回地址
			return (void *)b; 
		} else {
            // pMeta这块内存已经用完了
			if (pMeta->slot_exhausted) {
				pMeta->slot_bump_addr = theLimit;
				return 0;				 // We're toast
			} else {
				// One thread will grow the heap, others will see its been grown and retry allocation
				_malloc_lock_lock(&nanozone->band_resupply_lock[mag_index]);
				// 由于多线程，这里再次进行检查是否用完
				if (pMeta->slot_exhausted) {
					_malloc_lock_unlock(&nanozone->band_resupply_lock[mag_index]);
					return 0; // Toast
				} else if (b < pMeta->slot_limit_addr) {
                    // 如果小于最大限制地址，当重新申请一个新的band后，重新尝试while
					_malloc_lock_unlock(&nanozone->band_resupply_lock[mag_index]);
					continue; 
				} else if (segregated_band_grow(nanozone, pMeta, slot_bytes, mag_index)) {
                    // 申请新的band成功，重新尝试while
					_malloc_lock_unlock(&nanozone->band_resupply_lock[mag_index]);
					continue; 
				} else {
					pMeta->slot_exhausted = TRUE;
					pMeta->slot_bump_addr = theLimit;
					_malloc_lock_unlock(&nanozone->band_resupply_lock[mag_index]);
					return 0;
				}
			}
		}
	}
}

该方法里面主要是去堆上获取一块合适的内存。

memset(ptr, 0, slot_bytes)

根据传入cleared_requested参数，来决定是否给内存初始化为0

malloc

在底层中，除了常用的alloc方法之外，还有malloc也经常使用。我们看一下实现，发现具体有什么区别。

1. malloc

void *
malloc(size_t size)
{
	return _malloc_zone_malloc(default_zone, size, MZ_POSIX);
}

内部调用了_malloc_zone_malloc()方法

2. _malloc_zone_malloc

MALLOC_NOINLINE
static void *
_malloc_zone_malloc(malloc_zone_t *zone, size_t size, malloc_zone_options_t mzo)
{
	MALLOC_TRACE(TRACE_malloc | DBG_FUNC_START, (uintptr_t)zone, size, 0, 0);

	void *ptr = NULL;

	if (malloc_check_start) {
		internal_check();
	}
	if (size > MALLOC_ABSOLUTE_MAX_SIZE) {
		goto out;
	}

	ptr = zone->malloc(zone, size);		// if lite zone is passed in then we still call the lite methods

	if (os_unlikely(malloc_logger)) {
		malloc_logger(MALLOC_LOG_TYPE_ALLOCATE | MALLOC_LOG_TYPE_HAS_ZONE, (uintptr_t)zone, (uintptr_t)size, 0, (uintptr_t)ptr, 0);
	}

	MALLOC_TRACE(TRACE_malloc | DBG_FUNC_END, (uintptr_t)zone, size, (uintptr_t)ptr, 0);
out:
	if (os_unlikely(ptr == NULL)) {
		malloc_set_errno_fast(mzo, ENOMEM);
	}
	return ptr;
}

该方法中最终返回结果是一个指针，所以最重要的是16行。它创建了一块内存，并让ptr指向它。
这个时候点击它的实现，发现也跳转不进去。这个时候还是使用汇编手段，可以得知它调用default_zone_malloc方法

3. default_zone_malloc

static void *
default_zone_malloc(malloc_zone_t *zone, size_t size)
{
	zone = runtime_default_zone();
	
	return zone->malloc(zone, size);
}

该方法调用zone->malloc方法，仍然点不进去，继续查看汇编。发现调用了nano_malloc方法

4. nano_malloc

static void *
nano_malloc(nanozone_t *nanozone, size_t size)
{
	if (size <= NANO_MAX_SIZE) {
		void *p = _nano_malloc_check_clear(nanozone, size, 0);
		if (p) {
			return p;
		} else {
			/* FALLTHROUGH to helper zone */
		}
	}

	malloc_zone_t *zone = (malloc_zone_t *)(nanozone->helper_zone);
	return zone->malloc(zone, size);
}

这里有两处返回值，通过断点调试得知一般走_nano_malloc_check_clear方法
看到这个方法有没有一丝丝熟悉？原来它开辟内存调用的方法和calloc调用的是同一个方法。此处仔细对比发现，虽然是调用同一个方法，但是参数穿的不同

// calloc中
void *p = _nano_malloc_check_clear(nanozone, total_bytes, 1);
// malloc中
void *p = _nano_malloc_check_clear(nanozone, size, 0);

static void *
_nano_malloc_check_clear(nanozone_t *nanozone, size_t size, boolean_t cleared_requested)

发现cleared_requested这个参数传的不同。calloc是1，malloc是0。那个这个参数有什么作用？
我们进入这个方法，发现以下实现

if (cleared_requested && ptr) {
    memset(ptr, 0, slot_bytes);
}

原来是对开辟的内存进行初始化。calloc会对它初始化，malloc不会对它初始化

总结

我们最终可以得出以下结论

malloc和calloc其实底层都调用的同一套开辟内存方法
不同在于，calloc在开辟完内存会进行初始化，malloc不会进行初始化，则是原始脏数据。如果需要使用malloc这块内存，还需要我们手动初始化

_祀梦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
iOS中malloc和calloc源码分析

iOS中malloc和calloc源码分析2. _malloc_zone_calloc该方法中最终返回结果是一个指针，所以最重要的是13行。它创建了一块内存，并让指向它。这个时候，我们点击跳转对应的实现，发现点不进去。这个时候才用汇编方式，看到该方法最终跳转至方法
复制链接

扫一扫