关于编译型语言函数的调用(二)

接上文: http://blog.csdn.net/prsniper/article/details/40652451


上文中提到的局部变量的地址,第一个是[ebp-4],由于32位内存对齐的原因,第二个是[ebp-8],对于VC7以上的版本,这个地址可能会不一样

比如第一个可能是[ebp-8],第二个飞到[ebp-14],这是VS.NET的VC编译器在每个局部变量前后都加一个DWORD,值自然是0xCCCCCCCC

debug下如果函数结束后,这些DWORD的值不是0xCCCCCCCC那么说明代码意外的访问了不该访问的地方,即溢出


下面我们进入有返回值的,默认__cdecl约定的函数看看:

122:      ret = fnDefaultCall(4, 5, 6, &var1);
0040136B   lea         eax,[ebp-14h]
0040136E   push        eax
0040136F   push        6
00401371   push        5
00401373   push        4
00401375   call        @ILT+0(fnDefaultCall) (00401005)
0040137A   add         esp,10h
0040137D   mov         dword ptr [ebp-18h],eax
123:
有了前面的知识,调用简单了,传址吗,把地址装到eax,push到堆栈,等等

咦?这个eax传送到ret的地址,这不是变量没有初始化就使用吗?或者eax是ret的地址也就是ebp-14,这是怎么回事?

元芳说,VC中函数使用eax和edx作为返回值! 你要早这么说,我就了然了...

我们跟踪进去,看看它都做了什么勾当,关键在这几个地方

31:       p = (int *)arg4;
004011CC   mov         eax,dword ptr [ebp+14h]
004011CF   mov         dword ptr [ebp-10h],eax
32:       *p = 7;
004011D2   mov         ecx,dword ptr [ebp-10h]
004011D5   mov         dword ptr [ecx],7
33:
34:       return 0;
004011DB   xor         eax,eax
35:   }
004011DD   pop         edi
首先传进来的DWORD是指针,汇编语言满天都是指针,相比高级语言的指针就少得多,vb等干脆就没有指针的概念,

C/C++则能兼容大部分汇编语言的功能,强制转换,那么接下来赋值就好理解了,*p = 7就是

move p的值到ecx, 再mov 7到[ecx]就是ecx指向的内存地址

如果是*(int *)arg4 = 7就是 mov ecx, [ebp+14h]再 mov [ecx], 7了,注意如果是 arg4 =7那就不一样就修改地址的值为7,而不是值为7了

后面return 0就是xor eax, 任何数xor自身都变0,eax作为返回值,如前面所说

执行完毕,main函数的var1=7;ret=0;


接下来,我们就要调用__stdcall的函数,这个东西古老的pascal就使用这种约定,然而要说明的一点是,所有的Windows API也使用这种约定

那么我们就一探究竟吧!

124:      ret = fnStandardCall(8, 9, 10, &var1);
00401380   lea         ecx,[ebp-14h]
00401383   push        ecx
00401384   push        0Ah
00401386   push        9
00401388   push        8
0040138A   call        @ILT+20(fnStandardCall) (00401019)
0040138F   mov         dword ptr [ebp-18h],eax
125:
从调用的指令一看,细心的你会立刻发现,这小姑娘身上好像少了点什么挂件,阿弥陀佛,罪过!罪过!

不错,前面函数调用结束后都有add esp,xxx把之前push的参数都弹出,这里却没有,真是奇哉怪也!

那么我们就跟踪进入阴暗的小巷,看看他都做了什么勾当!

37:   int __stdcall fnStandardCall(int arg1, short arg2, char arg3, void *arg4)
38:   {
00401200   push        ebp
00401201   mov         ebp,esp
00401203   sub         esp,50h
00401206   push        ebx
00401207   push        esi
00401208   push        edi
00401209   lea         edi,[ebp-50h]
0040120C   mov         ecx,14h
00401211   mov         eax,0CCCCCCCCh
00401216   rep stos    dword ptr [edi]
39:       int var1;
40:       short var2;
41:       char var3;
42:       int *p;
43:
44:       var1 = arg1;
00401218   mov         eax,dword ptr [ebp+8]
0040121B   mov         dword ptr [ebp-4],eax
45:       var2 = arg2;
0040121E   mov         cx,word ptr [ebp+0Ch]
00401222   mov         word ptr [ebp-8],cx
46:       var3 = arg3;
00401226   mov         dl,byte ptr [ebp+10h]
00401229   mov         byte ptr [ebp-0Ch],dl
47:       p = (int *)arg4;
0040122C   mov         eax,dword ptr [ebp+14h]
0040122F   mov         dword ptr [ebp-10h],eax
48:       *p = 11;
00401232   mov         ecx,dword ptr [ebp-10h]
00401235   mov         dword ptr [ecx],0Bh
49:
50:       return 0;
0040123B   xor         eax,eax
51:   }
0040123D   pop         edi
0040123E   pop         esi
0040123F   pop         ebx
00401240   mov         esp,ebp
00401242   pop         ebp
00401243   ret         10h
上面的东西与默认的__cdecl约定一摸一样,曾泰说:恩师所言,丝毫不差!

最后是关键, 以前的ret, 变成了ret 10h,跑到这,或者说合并到这里了,元芳说: 事情的真相居然是这样!

这所谓的维护堆栈,不过是干完事,谁来清理现场而已嘛!

是这样,而不全然这么肤浅,比如API只要把参数传递进来,获取返回值即可,所以这是一种给调用者偷懒的约定.


那么接下来就是fastcall了,顾名思义应该是快速调用,怎么个快速法呢?看调用

125:
126:      ret = fnFastCall(11, 12, 13, &var1);
00401392   lea         edx,[ebp-14h]
00401395   push        edx
00401396   push        0Dh
00401398   mov         edx,0Ch
0040139D   mov         ecx,0Bh
004013A2   call        @ILT+25(fnFastCall) (0040101e)
004013A7   mov         dword ptr [ebp-18h],eax
127:
乖乖呀,只有两个push,第一第二个参数直接传送的ecx和edx,其他的跟__stdcall一摸一样!

这不用push也可以吗? 这个问题应该这样问,为什么一定要push才可以呢!我们再跟踪看看详细的:

53:   int __fastcall fnFastCall(int arg1, short arg2, char arg3, void *arg4)
54:   {
00401260   push        ebp
00401261   mov         ebp,esp
00401263   sub         esp,58h
00401266   push        ebx
00401267   push        esi
00401268   push        edi
00401269   push        ecx
0040126A   lea         edi,[ebp-58h]
0040126D   mov         ecx,16h
00401272   mov         eax,0CCCCCCCCh
00401277   rep stos    dword ptr [edi]
00401279   pop         ecx
0040127A   mov         word ptr [ebp-8],dx
0040127E   mov         dword ptr [ebp-4],ecx
关键就在前面这几条指令,在创建函数临时堆栈时,编译器保护了这两个寄存器,然后自动创建两个局部变量把他们保存起来

所以说,编译器不是人,它不管这些!因而,C/C++的效率虽然高,正常的程序员写出来的程序比起汇编语言还是差一大截,除非内联汇编或者经过优化

以后我们讲到裸函数的时候再说这一点, 函数往后的代码就好理解了,与前面的几乎一模一样

65:
66:       return 0;
004012A4   xor         eax,eax
67:   }
004012A6   pop         edi
004012A7   pop         esi
004012A8   pop         ebx
004012A9   mov         esp,ebp
004012AB   pop         ebp
004012AC   ret         8
注意后面的ret 8,因为后面直接恢复esp,因而过程中的push都静悄悄的被pop了


接着我们说thiscall,当调用一个类的成员变量时,自动传递了this指针,因而thiscall是隐式的声明

我们先看new一个对象的汇编指令:

128:      pCall = new CCall();
004013AA   push        4
004013AC   call        operator new (004015b0)
004013B1   add         esp,4
004013B4   mov         dword ptr [ebp-20h],eax
004013B7   mov         dword ptr [ebp-4],0
004013BE   cmp         dword ptr [ebp-20h],0
004013C2   je          main+0A1h (004013d1)
004013C4   mov         ecx,dword ptr [ebp-20h]
004013C7   call        @ILT+35(CCall::CCall) (00401028)
004013CC   mov         dword ptr [ebp-2Ch],eax
004013CF   jmp         main+0A8h (004013d8)
004013D1   mov         dword ptr [ebp-2Ch],0
004013D8   mov         eax,dword ptr [ebp-2Ch]
004013DB   mov         dword ptr [ebp-1Ch],eax
004013DE   mov         dword ptr [ebp-4],0FFFFFFFFh
004013E5   mov         ecx,dword ptr [ebp-1Ch]
004013E8   mov         dword ptr [ebp-10h],ecx
在这个级别, new 其实是一个函数. 而且可以看出,CCall的内存大小是四字节.

返回后保存到pCall即[ebp-20],这里突然冒出一句mov [ebp-4], 0,后面我们再说

然后判断返回的指针是否为NULL,cmp指令,如果为NULL跳转到0x004013d1,即mov  dword ptr [ebp-2Ch],0这条

如果不为零继续执行

mov         ecx,dword ptr [ebp-20h]

call        @ILT+35(CCall::CCall) (00401028)

[ebp-20]就是pCall,call的是类的构造函数,哄哄,原来把this传送到了ecx里面,再跟踪看看构造函数

00401079   push        ecx
0040107A   lea         edi,[ebp-44h]
0040107D   mov         ecx,11h
00401082   mov         eax,0CCCCCCCCh
00401087   rep stos    dword ptr [edi]
00401089   pop         ecx
0040108A   mov         dword ptr [ebp-4],ecx
6:        m_Var1 = 18;
0040108D   mov         eax,dword ptr [ebp-4]
00401090   mov         dword ptr [eax],12h
7:    }
00401096   mov         eax,dword ptr [ebp-4]
先把ecx(也就是thsi指针)保存,创建临时堆栈以后,创建一个临时变量代替ecx,即[ebp-4],因为m_Var1是第一个成员,类只占4个字节

所以直接传送到eax即[ebp-4],然后把ebp-4的值传送给eax,可以看出编译器绕了一大段弯子,这就是为什么以前谈游戏看法的时候

我尽可能的使用C语言,而不用C++的原因,此外可以看出,构造函数是有返回值的,返回值就是this!

回到调用代码,正常初始化后直接跳转,跳过new失败的这条

004013D1   mov         dword ptr [ebp-2Ch],0

而后一大堆mov传来传去,eax就是返回值this,传给[ebp-2c],然后如果new失败[ebp-2c]又传进0,然后又传给eax,然后传给[ebp-1c]!!!

作为一个追求完美的技术人员,恨不得把微软千刀万剐!

看判断new返回值之前有个[ebp-4]赋值为0,此时再赋值为-1,然后又把[ebp-1c]传来传去的0传给ecx,再把ecx传给[ebp-10],无语了吧!

别看这么多飞来飞去,如果正常初始化执行成功,[ebp-10]就是类的指针,如果new失败则是0即NULL!


下面就是调用成员函数了:

129:      ret = pCall->Call(15, 16, 17, &var1);
004013EB   lea         edx,[ebp-14h]
004013EE   push        edx
004013EF   push        11h
004013F1   push        10h
004013F3   push        0Fh
004013F5   mov         ecx,dword ptr [ebp-10h]
004013F8   call        @ILT+30(CCall::Call) (00401023)
004013FD   mov         dword ptr [ebp-18h],eax
同样this指针被传送到ecx,返回值保存在eax寄存器中.参数从右向左依次入栈. 堆栈成员函数自动清理
004010E9   push        ecx
004010EA   lea         edi,[ebp-54h]
004010ED   mov         ecx,15h
004010F2   mov         eax,0CCCCCCCCh
004010F7   rep stos    dword ptr [edi]
004010F9   pop         ecx
004010FA   mov         dword ptr [ebp-4],ecx
15:       int var1;
16:       short var2;
17:       char var3;
18:       int *p;
19:       var1 = arg1;
004010FD   mov         eax,dword ptr [ebp+8]
00401100   mov         dword ptr [ebp-8],eax
20:       var2 = arg2;
00401103   mov         cx,word ptr [ebp+0Ch]
00401107   mov         word ptr [ebp-0Ch],cx
21:       var3 = arg3;
0040110B   mov         dl,byte ptr [ebp+10h]
0040110E   mov         byte ptr [ebp-10h],dl
22:       p = (int *)arg4;
00401111   mov         eax,dword ptr [ebp+14h]
00401114   mov         dword ptr [ebp-14h],eax
23:       *p = m_Var1;
00401117   mov         ecx,dword ptr [ebp-14h]
0040111A   mov         edx,dword ptr [ebp-4]
0040111D   mov         eax,dword ptr [edx]
0040111F   mov         dword ptr [ecx],eax
24:       return 0;
00401121   xor         eax,eax
25:   }
可以看出,仍然创建一个临时变量来保存ecx(就是[ebp-4]),然后以此引用成员变量,可见thiscall比起上面的各种调用约定都要啰嗦

都要慢, 不过这是面向对象对象的代价,开发和维护更简单,牺牲的就是执行效率,这个只能靠硬件性能来弥补;

同理,.NET开发和维护调试超级容易,容错能力极其强大,还牺牲了安全性,在dis#面前,源代码完全暴露...


那么又是int3的时候了,下文我们说最后一个函数的有关知识,裸函数!


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
随着国家大数据战略的深入实施,各行业智慧化建设急需数据分析人才和智能应用人才。智慧化简单来说是一个以机器替换人力的过程,而机器的“灵魂”是程序。Python已经成为公认的驱动大数据智能应用的主流编程语言。Python程序设计的书籍已经琳琅满目,每一本书都凝聚了作者对Python的理解和对程序设计的认识,都是作者编程开发和教学经验的总结,都折射出作者的专业背景。由于大数据专业学生对程序设计的要求不是很高,但又需要具备一定的计算思维能力,熟悉用程序进行数据分析的一般流程,因此程序设计教材要言不甚深、文不甚俗,既要覆盖相关技术,又不能面面俱到,注重对问题的分析和解释,用程序表达算法。鉴于此,我们编写了本书。 本书每一章的标题都以Python开头,凸显Python在各个部分都有其独特的编程理念和方法。与其他高级编程语言如C、C++和Java等相比,Python在数据的表示、处理和可视化方面都有绝对的优势。有编程基础的学习者在学习Python时最好能忘掉以往程序设计语言的语法,彻底转变观念,以全新的姿态融入到Python的编程特点和规律之中。如变量定义、数据类、数据结构、控制结构、类和对象、文件访问、数据分析和可视化,每一部分都有其特别之处,都值得我们重新认识,重新使用,重新熟悉。每一章开始的思维导图都是对本章技术脉络的梳理,开门见山地给学习者展示本章的知识和技术体系,以便学习者在学习过程中始终能保持思路清晰和整体把握。每一章开头的本章导读都是编者多年来程序开发与设计教学经验的提炼与升华,都是对程序设计的理解和感悟,值得学习者深入领会。每一章开头的本章要点都是要求学习者深入理解的重要知识和熟练掌握的关键技术。每一章的小结都是对本章要点的具体解释,供学习者复习查询。 本书为河北省高等教育教学改革研究与实践项目“新工科背景下警务大数据应用专业人才培养模式与教学实践研究”(编号:2018GJJG450)的阶段性成果。 下面是本书的体系结构图。 第1章Python编程初步。学习本章,要了解Python作为一种计算机程序设计脚本语言,结合了解释性、编译性和互动性的特点;了解在Linux和Windows中安装Python的方法;了解IDLE、PyCharm和Jupyter三种常用Python程序编辑环境。工欲善其事,必先利其器,通过对本章的学习,学习者可拥有一个强大的编程工具,从此开启数据分析编程之旅。 第2章Python语言基础。Python作为一门与计算机交流的编程语言,有着跟自然语言相似的特点:字、词、句、段落、篇章,以及相应的行文语法规则。学习本章,要理解程序行文的字词句,主要包括基本数据类、常量和变量、运算符和表达式;理解程序的段落和篇章,主要包括常用内置函数、库函数和系统函数的使用;掌握程序的语法规则,主要包括常用的变量定义和标识符命名规则、语句组织成文编码规则等。这些都是程序设计的基础,学习者只有对此熟练掌握后,才能在后续的学习中得心应手。 第3章Python组合数据类。组合数据类是Python语言区别于其他高级编程语言的一大特色,通过组合数据类,省去了其他语言各种复杂数据结构的设计,给编程人员带来了极大的方便,这也是Python流行于数据分析领域的原因之一。学习本章,要熟练掌握Python组合数据类(列表、元组、字符串、字典、集合)的创建、访问和常见基本操作,以及序列解包功能。 第4章 Python控制结构。针对物质随时间由简单向复杂、由低级向高级发展的顺序,Python语言有相应的顺序结构语句;针对物质运动发展的条件性,Python语言有相应的选择结构语句;针对物质运动的波浪式前进螺旋式上升规律,Python语言有相应的循环结构语句。学习本章,要从马克思主义自然哲学视角理解Python语言在描述物质运动规律时的表达方式;掌握用Python语言描述常用算法,解决一些基本问题的方式。 第5章 Python函数与模块。有些经常用到的能实现特定功能的代码块,我们总是不希望每次用到时都重写一遍,甚至不希望复制一遍,但又想重复使用。Python里这些经常重用的代码块以函数(Function)的形式被定义,每一次复用被称为函数调用,计算机依然要执行重用的代码。学习本章,要理解函数的概念,掌握定义函数的方法,深刻理解函数调用中参数的传递(值传递、地址传递),理解变量的作用域(变量的作用范围或变量的生命周期),理解函数集合模块、包等概念,掌握模块和包的创建及使用方法。 第6章 Python面向对象程序设计。面向过程的程序设计方法难以保证程序的安全性和代码的可重用性,而面向对象的程序设计方法能够更好地提高大程序的质量和开发效率,增强程序的安全性和提高代码的可重用性。学习本章,重在理解面向对象程序设计思想、类和对象的概念

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值