转:Objective-C Message

转自:http://www.cnblogs.com/studentdeng/archive/2011/10/06/2199873.html

 

object c 里面有一个非常有趣的设计,如果之前了解过c++的家伙们,对object c 中的把传统的调用函数变成了向这个类发送消息,这个过程总是令人琢磨不透,在实际过程中遇到的crash也很难调试清楚。这篇就要详细的解释消息这个家伙。当然,消息这个涉及的东西实在是太多了。这篇先简单介绍一下。

上一篇,我们了解了什么是类http://www.cnblogs.com/studentdeng/archive/2011/10/01/2197194.html。同理这一篇,我们首先需要了解什么是message。

message(消息):message的具体定义很难说,因为并没有真正的代码描述,简单的讲message 是一种抽象,包括了函数名+参数列表,他并没有实际的实体存在。

method(方法):method是真正的存在的代码。如:- (int)meaning { return 42; }

selector: selector 通过SEL类型存在,描述一个特定的method or message。在实际编程中,可以通过selector来检索函数等操作。

我不知道上面这种描述有多少人可以明白,因为我觉得这3个每个人都可以有自己的看法,在了解object c message 的整个过程之后。

让我们从一个简单的例子开始。当我们写好如下的代码时

?
- ( int )foo:( NSString *)str { ...}

  

编译器事实上转成了下面的样子
?
int XXXX_XXXX_foo_(SomeClass * self , SEL _cmd, NSString *str) { ...}

  

当我们写下发送消息的代码如
?
int result = [obj foo:@ "hello" ];

  

实际上变成了
?
int result = (( int (*)( id , SEL , NSString *))objc_msgSend)(obj, @selector (foo:), @ "hello" );

  

而 objc_msgSend 是一个我们非常熟悉的C函数定义 id objc_msgSend(id self, SEL    _cmd,...);
那么,object c 发送消息就变成了一个表面上看似容易理解的C函数调用了,这里有必要解释一下几个名词
 
id:很多地方说id是一个void *的指针。事实上,id 其实是这样子的
?
typedef struct objc_object {
     Class isa;
} * id ;

  

也就是说。id其实是一个可以指向任何一个object指针(只要结构体中包含isa 指针) 。

SEL:SEL 如果很粗鲁(我不知道改用什么其他词汇更容易描述)的讲,就是一个char * 的指针。因为你可以这样简单粗暴的测试

?
SEL selector = @selector (message); //@selector不是函数调用,只是给这个坑爹的编译器的一个提示
NSLog (@ "%s" , ( char *)selector);  //print message

  

注:这里之所以说粗鲁,是因为,这个的定义和object runtime 的具体实现息息相关,未来很可能改变,而这些定义也是没有文档化的,后面还会详细介绍SEL的具体实现。因为这里有不少为了提高效率而做的优化。

不知道有没有人惊呼这个问题。特别是如果之前从事C++的家伙们。传统的C++ 编译器在处理函数上,为了支持函数重载。使用了一种函数别名的方式如

?
int foo( int a);

  

变成了 XXX_1_foo_int (具体的形式没有意义,核心在于,编译器生成的函数签名包括函数名,参数类型,参数个数)。

但我们的SEL 仅仅是函数名而已。

有了这些知识做铺垫,原谅我在把这个东东再搬出来

?
int result = (( int (*)( id , SEL , NSString *))objc_msgSend)(obj, @selector (foo:), @ "hello" );

  

那么,作为程序员,我们就为这个而疯狂了,因为编译器无法根据id 和SEL 获得完整的函数签名,编译器对参数个数和类型,完全不知道。那么他如何能过做到识别这些并找到正确的代码呢?

事实上这个头痛的问题,编译器做了一个非常坑爹的事情,就是“ it cheats” ,他假装能够通过函数名,就能确定正确的代码。通过扫描之前的函数声明来做,如果没有找到,编译器就认为这是一个运行时(runtime)的函数而直接略过。而这也就导致了object c 在处理有相同函数名和参数个数但类型不同的函数时,非常的弱。如

?
-( void )setWidth:( int )width;
  
-( void )setWidth:( double )width;

  

这样的函数则被认为是一种编译错误,而这最终导致了一个非常非常奇怪的object c 特色的函数命名

?
-( void )setWidthIntValue:( int )width;
  
-( void )setWidthDoubleValue:( double )width;

  

注:这样的函数命名的好坏,只能说是因人而异的,站在我的角度来讲。object c 的这种命名实在是太臃肿了,这种冗长的名字让人感到作呕而没有任何美感。当然,这样的命名的确可以避免很多的错误,比如因C++ 函数重载而引起的人为上的小失误,而且减少了理解函数的负担。总有利弊,需要平衡:P,不过,我还是不喜欢object c 编译器,因为他彻底阻挡了你的想法,至于为什么这样设计,我的理解是为了runtime,在这里为了性能而做了妥协,具体原因,后面再讲。

popup our brain stack

objc_msgSend 这里传入了 class 指针 self  函数名SEL 已经后面通过C的不定参数传入的参数。通过这些条件。就像之前的C++函数那样,需要查表,并找到相应函数的位置,然后call xxxxx。那么。object c 是如何找到这些函数的真实地址呢? 之前有篇简单描述C++类函数布局的,有兴趣的可以对比的看。

为了解释这些这个过程,我们有需要介入一些名词了。

object c 2 的

?
typedef struct method_list_t {
     uint32_t entsize_NEVER_USE;  // low 2 bits used for fixup markers
     uint32_t count;
     struct method_t first;
} method_list_t;
  
typedef struct method_t {
     SEL name;
     const char *types;
     IMP imp;
} method_t;

  

method就是这么简单, 一个函数名SEL 一个包括的参数类型和返回类型的type 最后加一个IMP 而IMP 就是一个函数指针,指向我们真正的代码位置

?
typedef id             (*IMP)( id , SEL , ...);

  

那么objc_msgSend 做的事情,就是通过我们传入的self 指针,找到class 的method_list 然后根据SEL 做比较,没有的话,就在super class 找,如此往复。直到找到匹配的SEL,然后,call imp。

那么,我们就发现了。如果object c 这样设计,调用函数的成本实在是太高了,相对传统的C函数调用。那么编译器和runtime又做了那些优化呢?有意思的事情开始了。

1、字符串比较

我们发现了SEL 就是简单的一个char* 字符串。那么,光是比较这一串字符,就可以让object c 慢的让人作呕了。那么我们就需要再认识一下我们的SEL了。

runtime 在实现selector是,实现了一个很大的Set,简单的说就是一个经过了杠杠优化过的hash表。而Set的特点就是唯一,也就是SEL是唯一的。那么对于字符串的比较仅仅需要比较他们的地址就可以了。犀利,速度上无语伦比,但是,有一个问题,就是数量增多会增大hash冲突而导致的性能下降(或是没有冲突,因为也可能用的是perfect hash)。但是不管使用什么样的方法加速,如果能够将总量减少,那将是最犀利的方法。那么,我们就不难理解,为什么SEL仅仅是函数名了。这样如

class A 有一个这样的method  -(void)setWidth:(int)width;

而 classB 有一个这样的method -(void)setWidth:(double)width;

那么的selector 将指向同一个地方,使用同一个selector,如果真的需要在类中定义类似重载时,只能使用不同的函数名了。

但是,这样的优化,依然不能让人满意,因为,根据二八原则,我们真正执行的只是少数代码。那么。就有

2、cache

cache的原则就是缓存那些可能要执行的函数地址,那么下次调用的时候,速度就可以快速很多。这个和CPU的各种缓存原理相通。好吧,说了这么多了,再来认识几个名词

?
struct objc_cache {
     uintptr_t mask;            /* total = mask + 1 */
     uintptr_t occupied;        
     cache_entry *buckets[1];
};
  
typedef struct {
     SEL name;     // same layout as struct old_method
     void *unused;
     IMP imp;  // same layout as struct old_method
} cache_entry;

  

看这个结构,有没有搞错又是hash table。

objc_msgSend 首先在cache list 中找SEL 没有找到就在class 找,super class 找(当然super class 也有cache list)。

而cache的机制则非常复杂了,由于object c 是动态语言。所以,这里面还有很多的多线程同步问题,而这些锁又是效率的大敌,相关的内容已经远远超过本文讨论的范围。

popup our brain stack

有了上面的粗略的介绍,是时候让我们看看objc_msgSend 的真面目了,当然,对于这个家伙是和性能息息相关的东西,没有任何缘由的是用汇编来写的。这里面贴出x86的,原谅我已经把arm汇编忘记了(主要原因是arm汇编是老师教得,x86是自学的,没有听学校老师的 :P)。

?
/********************************************************************
  *
  * id objc_msgSend(id self, SEL    _cmd,...);
  *
  ********************************************************************/
   
     ENTRY    _objc_msgSend
     CALL_MCOUNTER    LP0
   
     movl    self (%esp), %eax
   
// check whether receiver is nil 
     testl    %eax, %eax
     je    LMsgSendNilSelf
   
// receiver is non-nil: search the cache
     CacheLookup WORD_RETURN, MSG_SEND, LMsgSendCacheMiss
     movl    $kFwdMsgSend, %edx    // flag word-return for _objc_msgForward
     jmp    *%eax            // goto *imp
   
// cache miss: go search the method lists
LMsgSendCacheMiss:
     MethodTableLookup WORD_RETURN, MSG_SEND
     movl    $kFwdMsgSend, %edx    // flag word-return for _objc_msgForward
     jmp    *%eax            // goto *imp
   
// message sent to nil object: call optional handler and return nil
LMsgSendNilSelf:
     EXTERN_TO_REG(__objc_msgNil,%eax)
     movl    0(%eax), %eax        // load nil message handler
     testl    %eax, %eax
     je    LMsgSendDone        // if NULL just return and don't do anything
     call    *%eax            // call __objc_msgNil
     xorl    %eax, %eax        // Rezero $eax just in case
LMsgSendDone:
     ret
   
LMsgSendExit:
     END_ENTRY    _objc_msgSend

  

注释非常的详细+代码本身自解释,不做赘述,汇编的可读性都比我写的强,牛到不需要解释的代码。

MethodTableLookup 跳到__class_lookupMethodAndLoadCache
 
?
/***********************************************************************
* lookUpMethod.
* The standard method lookup. 
* initialize==NO tries to avoid +initialize (but sometimes fails)
* cache==NO skips optimistic unlocked lookup (but uses cache elsewhere)
* Most callers should use initialize==YES and cache==YES.
* May return _objc_msgForward_internal. IMPs destined for external use 
*   must be converted to _objc_msgForward or _objc_msgForward_stret.
**********************************************************************/
__private_extern__ IMP lookUpMethod(Class cls, SEL sel, 
                                     BOOL initialize, BOOL cache)
{
     Class curClass;
     IMP methodPC = NULL ;
     Method meth;
     BOOL triedResolver = NO ;
   
     // Optimistic cache lookup
     if (cache) {
         methodPC = _cache_getImp(cls, sel);
         if (methodPC) return methodPC;    
     }
   
     // realize, +initialize, and any special early exit
     methodPC = prepareForMethodLookup(cls, sel, initialize);
     if (methodPC) return methodPC;
   
   
     // The lock is held to make method-lookup + cache-fill atomic 
     // with respect to method addition. Otherwise, a category could 
     // be added but ignored indefinitely because the cache was re-filled 
     // with the old value after the cache flush on behalf of the category.
  retry:
     lockForMethodLookup();
   
     // Try this class's cache.
   
     self note 这里再次查找cache 是因为有可能cache真的又有了,因为锁的原因
     methodPC = _cache_getImp(cls, sel);
     if (methodPC) goto done;
   
     // Try this class's method lists.
   
      //self note 这个就是简单的在method 一个线性查找,因为我们仅仅是一个地址比较
     meth = _class_getMethodNoSuper_nolock(cls, sel); 
     if (meth) {
         //我们找到了函数地址,那么添加到cachelist中
         log_and_fill_cache(cls, cls, meth, sel);
         methodPC = method_getImplementation(meth);
         goto done;
     }
   
     // Try superclass caches and method lists.
   
     curClass = cls;
     while ((curClass = _class_getSuperclass(curClass))) {
         // Superclass cache.
         meth = _cache_getMethod(curClass, sel, &_objc_msgForward_internal);
         if (meth) {
             if (meth != (Method)1) {
                 // Found the method in a superclass. Cache it in this class.
                 log_and_fill_cache(cls, curClass, meth, sel);
                 methodPC = method_getImplementation(meth);
                 goto done;
             }
             else {
                 // Found a forward:: entry in a superclass.
                 // Stop searching, but don't cache yet; call method 
                 // resolver for this class first.
                 break ;
             }
         }
   
         // Superclass method list.
         meth = _class_getMethodNoSuper_nolock(curClass, sel);
         if (meth) {
             log_and_fill_cache(cls, curClass, meth, sel);
             methodPC = method_getImplementation(meth);
             goto done;
         }
     }
   
     // No implementation found. Try method resolver once.
   
     if (!triedResolver) {
         unlockForMethodLookup();
         _class_resolveMethod(cls, sel);
         // Don't cache the result; we don't hold the lock so it may have 
         // changed already. Re-do the search from scratch instead.
         triedResolver = YES ;
         goto retry;
     }
   
     // No implementation found, and method resolver didn't help. 
     // Use forwarding.
   
     _cache_addForwardEntry(cls, sel);
     methodPC = &_objc_msgForward_internal;
   
  done:
     unlockForMethodLookup();
   
     // paranoia: look for ignored selectors with non-ignored implementations
     assert(!(sel == ( SEL )kIgnore  &&  methodPC != (IMP)&_objc_ignored_method));
   
     return methodPC;
}

  

牛到不需要解释的代码。而且这里面,我们发现了另一个被我拉下的东西,消息的转发。这个东西还是下一篇处理。不想再写长篇大论了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值