史上最详细的C++函数重载机制

函数重载


		——每个现象后面都隐藏一个本质,关键在于我们是否去挖掘

[前言]
函数重载的重要性不言而明,但是你知道 C++ 函数重载是如何实现的吗?这个可以分为下面两个问题

  • 声明/定义重载函数时,是如何解决命名冲突的?(抛开函数重载不谈,using 就是一种解决命名冲突的方法,解决命名冲突还有很多其它方法)
  • 当我们调用一个重载的函数时,又是如何去解析的?(即怎么知道调用的是哪个函数呢)

这两个问题是任何支持函数重载的语言都必须解决的问题!带着这两个问题,开始讨论函数重载吧!


1. 例子引入(现象)

1.1 什么是函数重载(what)?

函数重载是指在同一作用域内,可以有一组相同函数名,不同参数列表的函数,这组函数被称为函数重载。重载函数通常用来命名一组功能相似的函数,这样做减少了函数名的数量,避免了命名空间的污染,对于程序的可读性有很大的好处。


When two or more different declarations are specified for a single name in the same scope, that name is said to overloaded. By extension, two declarations in the same scope that declare the same name but with different types are called overloaded declarations. Only function declarations can be overloaded; object and type declarations cannot be overloaded.
——摘自《ANSI C++ Standard. P290》

下面看一个例子,体会一下函数重载:实现一个相加函数,既可以进行整数相加,也可以实现浮点数和长整型相加。在C++中,我们可以这样做:

#include<iostream>
using namespace std;
void print(int i)
{
        cout<<"print a integer :"<<i<<endl;
}

void print(string str)
{
        cout<<"print a string :"<<str<<endl;
}

int main()
{
        print(12);
        print("hello world!");
        return 0;
}

通过上面代码的实现,可以根据具体的print()的参数去调用print(int)还是print(string)。上面print(12)会去调用print(int),print(“hello world”)会去调用print(string),如下面的结果:(先用g++ test.c编译,然后执行)
在这里插入图片描述


1.2 为什么需要函数重载(why)?
  • 试想一下。如果没有函数重载,如在 C 中,你必须要这样去做:为这个 print 函数取不同的名字,如 print_int、print_string。这还只是两种情况,如果是很多个的话,就需要为实现同一个功能的函数取很多个名字,如加入打印 long 型、char*、各种类型的数字等等。这样做很不友好!
  • 类的构造函数跟类名相同,也就是说:构造函数都同名。如果没有函数重载机制,要想实现实例化不同的对象,那是相当的麻烦!
  • 操作符重载,本质上就是函数重载,它大大丰富了已有操作符的含义,方便使用,如 + 可用于连接字符串等!

通过上面的介绍我们对函数重载,应该唤醒了我们对函数重载的大概记忆。下面我们就来分析,C++是如何实现函数重载机制的。


2. 编译器如何解决命名冲突的?

为了了解编译器是如何处理这些重载函数的,我们反编译下上面我们生成的执行文件,看下汇编代码(全文都是在Linux下面做的实验,Windows类似,你也可以参考《一道简单的题目引发的思考》一文,那里既用到Linux下面的反汇编和Windows下面的反汇编,并注明了Linux和Windows汇编语言的区别)。我们执行命令objdump -d a.out >log.txt反汇编并将结果重定向到log.txt 文件中,然后分析 log.txt 文件。

  1. 发现函数void print(int i)编译之后为:(注意它的函数签名变为——_Z5printi
    在这里插入图片描述

  1. 发现函数void print(string str)编译之后为:(注意它的函数签名变为——_Z5printNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEE),其实 basic_string 是一个模板类,string 是模版形参为 char 的 basci_string 模版类的类型定义
    在这里插入图片描述

  1. 我们可以发现编译之后,重载函数的名字变了不再都是 print!这样不存在命名冲突的问题了,但是又有一个新的问题——变名机制是怎样的,即如何将一个重载函数的签名映射到一个新的标识?我的第一反应是:函数名 + 参数列表,因为重载函数取决于参数的类型,个数,而与返回值无关。但看下面的映射关系
    void print(int i) – > _Z5printi
    void print(string str) – >
    _Z5printNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEE
  2. 进一步猜想,前面的 Z5 表示返回值类型,print 为函数名,i 表示整型,basic_string 表示字符串,即映射为 返回类型 + 函数名 + 参数列表。最后在 main 函数中就是通过 这两个名称来调用对应的函数的。
    在这里插入图片描述
    在这里插入图片描述
  3. 我们发现好像 string 有点特殊,我们再写几个重载函数验证一下猜想,如:
    void print(double l) --> _Z5printd
    void print(char c) --> _Z5printc
    可以发现大概是int->i,double->d,char->c….基本上都是用首字母代表,现在我们来现在一个函数的返回值类型是否真的对函数变名有影响,如:
#include<iostream>
using namespace std;

int max(int a,int b)
{
        return a>=b?a:b;
}

double max(double a,double b)
{
        return a>=b?a:b;
}
int main()
{
        cout<<"max int is: "<<max(1,3)<<endl;
        cout<<"max double is: "<<max(1.2,1.3)<<endl;
        return 0;
}

【运行结果】
在这里插入图片描述

int max(int a,int b) 映射为_Z3maxii、double max(double a,double b) 映射为_Z3maxdd,这证实了我的猜想,Z后面的数字代表的是函数名的字符个数。更加详细的对应关系,如那个数字对应那个返回类型,哪个字符代表哪重参数类型,就不去具体研究了,因为这个东西跟编译器有关,上面的研究都是基于g++编译器,如果用的是vs编译器的话,对应关系跟这个肯定不一样。但是规则是一样的:“函数名长度+函数名+参数列表”


既然返回类型也考虑到映射机制中,这样不同的返回类型映射之后的函数名肯定不一样了,但为什么不将函数返回类型考虑到函数重载中呢?——这是为了保持解析操作符或函数调用时,独立于上下文(不依赖于上下文),看下面的例子

float sqrt(float);
double sqrt(double);

void f(double da, float fla)
{
      float fl=sqrt(da);//调用sqrt(double)
      double d=sqrt(da);//调用sqrt(double)

      fl=sqrt(fla);//调用sqrt(float)
   d=sqrt(fla);//调用sqrt(float)
}

如果返回类型考虑到函数重载中,这样将不可能再独立于上下文决定调用哪个函数。


至此似乎已经完全分析清楚了,但我们还漏了函数重载的重要限定——作用域。上面我们介绍的函数重载都是全局函数,下面我们来看一下一个类中的函数重载,用类的对象调用print函数,并根据实参调用不同的函数:

#include<iostream>
using namespace std;

class test{
public:
        void print(int i)
        {
                cout<<"int"<<endl;
        }
        void print(char c)
        {
                cout<<"char"<<endl;
        }
};
int main()
{
        test t;
        t.print(1);
        t.print('a');
        return 0;
}

我们现在再来看一下这时print函数映射之后的函数名:
在这里插入图片描述
注意前面的 N4test,我们可以很容易猜到应该表示作用域。N4可能为命名空间、test类名等等。这说明最准确的映射机制为:作用域 + 函数名长度+ 函数名 + 参数列表

还有一点,关于函数重载,一个被大多数遗忘或者疏漏的地方,这种形参类型、形参个数完全相同的函数也是可以重载的,只要它的 const/volatiles 属性不同即可,下面看一个例子:

#include <iostream>
using namespace std;
struct foo{
	int bar() const {return 2;} ; //第一个重载函数
	int bar() {return 1;}; //第二个重载函数
};
int main()
{
	const foo a;
	a.bar(); 
	foo b;
	b.bar(); 
} 

我们查看一下反编译代码:可以看出这两个 bar 函数的命名并不相同
在这里插入图片描述
我们再查看一下main函数的调用情况
在这里插入图片描述
我通过单步跟踪,发现 a.bar() 调用的是第一个重载函数,b.bar() 调用的是第二个重载函数

看到这里,我想你应该弄明白了C++是怎么对重载函数进行命名的,那么你有没有想过一个问题,为什么 C++支持函数重载,而 C 语言不支持呢?
我们还是拿第一个例子:打印不同类型的函数,在 C 语言下,代码如下:

#include <stdio.h>
void print_int(int i)
{
       printf("%d\n", i);
}
void print_char(char c)
{
       printf("%c\n", c);
}
}
int main()
{
        print(1);
		print('a');
        return 0;
}

我们现在再来看一下这时print函数映射之后的函数名:
在这里插入图片描述
可以很容易观察到,在 C 语言下,映射机制就是直接使用函数名来进行映射的,跟函数的返回值,参数列表无关,所以注定 C 语言不能实现函数重载。


3. 重载函数的调用匹配

现在已经解决了重载函数命名冲突的问题,在定义完重载函数之后,用函数名调用的时候是如何去解析的?为了顾及哪个重载函数最适合,需要依次按照下列规则来判断:

  • 精准匹配:参数匹配不做转换,或者只是做微不足道的转换,如数组名到指针、函数名到指向函数的指针、T到 const T
  • 提升匹配:即整数提升(如 bool 到 int、char 到 int、short 到 int),float 到 double
  • 使用标准转换匹配:如 int 到 double、double 到 int、double 到 long double、Derived* 到 Base*、int 到 unsigned int
  • 使用用户自定义类型匹配
  • 使用省略号匹配:类似 printf 中省略号参数

如果在最高层有多个匹配函数找到,调用将被拒绝(有歧义)。看下面的例子:

void print(int);
void print(const char*);
void print(double);
void print(long);
void print(char);

void h(char c,int i,short s, float f)
{
     print(c);//精确匹配,调用print(char)
     print(i);//精确匹配,调用print(int)
     print(s);//整数提升,调用print(int)
     print(f);//float到double的提升,调用print(double)

     print('a');//精确匹配,调用print(char)
     print(49);//精确匹配,调用print(int)
     print(0);//精确匹配,调用print(int)
     print("a");//精确匹配,调用print(const char*)
}

定义太少或太多的重载函数,都有可能导致模凌两可,看下面的一个例子:

void f1(char);
void f1(long);

void f2(char*);
void f2(int*);

void k(int i)
{
       f1(i);//调用f1(char)? f1(long)?
       f2(0);//调用f2(char*)?f2(int*)?
}

这时候编译器就会报错,将错误抛给用户自己处理:通过显示类型转换来调用等等(如 f2(static_cast<int *>(o)),当然这样做很丑,而且你想调用别的方法时还要做转换))。上面的例子是一种参数的情况,下面看看两个参数的情况:

int pow(int ,int);
double pow(double,double);

void g()
{
       double d=pow(2.0,2)//调用pow(int(2.0),2)? pow(2.0,double(2))?
}

4. 编译器是如何让解析重载函数调用的?

编译器实现调用重载函数机制的时候,肯定是首先找出同名的一些候选函数,然后从候选函数中找出最符合的,如果找不到就报错。下面介绍一种重载函数解析的方法:编译器在对重载函数调用进行处理时,由语法分析、C++瓦讷费、符号表、抽象语法树交互出来(这里涉及到编译原理的知识),交互图大致如下:
在这里插入图片描述
这四个步骤所做的事情大致如下

  • 由匹配文法中的函数调用,获取函数名;
  • 获取函数各参数表达式类型
  • 语法分析器查找重载函数,符号表内部经过重载函数解析返回最佳的函数
  • 语法分析器创建抽象语法树,将符号表中存储的最佳函数绑定到抽象语法树上

下面我们重点解释一下重载解析,重载解析要满足前面《3、重载函数的调用匹配》中介绍的匹配顺序和规则。重载函数解析大致可以分为三步:

  • 根据函数名确定候选函数集
  • 从候选函数集中选择可用函数集合
  • 从可用函数集中确定最佳函数,或由于歧义返回错误

4.1 根据函数名确定候选函数集

根据函数在同一作用域所有同名函数,并且要求是可见的(像 private、protected、public、friend之类)。“同一作用域” 也是函数重载的定义中的一个限定,如果不在一个作用域,不能算是函数重载,如下面的代码:

void f(int);

void g()
{
        void f(double);
        f(1); //这里调用的是f(double),而不是f(int)
}

内层作用域的函数会隐藏外层的同名函数!同样的派生类的成员函数会隐藏基类的同名函数

为了查找候选函数集,一般采用深度优选搜索算法:

  • step1:从函数调用点开始查找,逐层作用域向外查找查找可见的候选函数
  • step2:如果上一步收集的不在用户自定义命名空间,则用到了 using 机制引入的命名空间中的候选函数,否则结束

在收集候选函数时,如果调用函数的实参类型为非结构体类型,候选函数仅包含调用点可见的函数;如果调用函数的实参类型包括类类型对象、类类型指针、类类型引用或指向类成员的指针,候选函数为下面集合的并:

  • (1) 在调用点上可见的函数
  • (2) 在定义该类类型的命名空间或定义该类的基类的命名空间中声明的函数
  • (3) 该类或其基类的友元函数

下面看一个例子更直观:

void f();
void f(int);
void f(double, double = 314);
namespace N
{ 
    void f(char3 ,char3);
}
class A{
   A(){}
};
int main ( )
{
    using namespace N; //使用N整个命名空间
    A a;
    f(a);
    return 0;
}

根据上述方法,由于实参是类类型的对象,候选函数的收集分为3步:

  • (1) 从函数调用的 main 函数作用域内开始查找函数的声明,结果未找到。到 main 函数作用域的外层作用域查找,此时在全局作用域中找到3个函数的声明,将它们放入候选集中
  • (2) 到using指示符所指向的命名空间 N中收集f ( char3 , char3 )
  • (3) 该类没有友元函数

最终候选集合为上述所列的4个函数 f


4.2 确定可用函数

可用函数是指:函数参数个数匹配并且每一个参数都有隐式转换序列

  • (1) 如果实参有 m 个参数,所有候选函数中,有且只有 m 个参数
  • (2) 所有候选函数中,参数个数不足 m 个,当且仅当参数列表中有省略号
  • (3) 所有候选函数中,参数个数超过 m 个,当且仅当第 m+1 个参数以后都有缺省值。如果可用集合为空,函数调用失败

4.3 确定最佳匹配函数

确定可用函数之后,对可用函数集中的每一个函数,如果调用函数的实参要调用它计算优先级,最后选出优先级最高的。如对《3、重载函数的调用匹配》中介绍的匹配规则中按顺序分配权重,然后计算总的优先级,最后选出最优的函数。


5. 总结

本文介绍了什么是函数重载、为什么需要函数重载、编译器如何解决函数重名问题、编译器如何解析重载函数的调用。通过本文,我想大家对C++中的重载应该算是比较清楚了。说明:在介绍函数名映射机制是基于g++编译器,不同的编译器映射有些差别;编译器解析重载函数的调用,也只是所有编译器中的一种。如果你对某个编译器感兴趣,请自己深入去研究。
最后我抛给大家两个问题:

  • 在 C++ 中加号,即可用于两个 int 型之间的相加、也可用于浮点数之间的相加、字符串之间的连接,那 + 算不算是操作符重载呢?换个场景C语言中加号+,即可用于两个int型之间的相加、也可以用于浮点数数之间的相加,那算不算操作符重载呢?
  • 模板(template)的重载是怎样的?模板函数和普通函构成的重载,调用时又是如何匹配的呢?

对于上面的问题一,我们举个超级简单的例子:

 1 #include <iostream>
 2 
 3 using namespace std;
 4 
 5 int main()
 6 {
 7     int a = 2 , b = 3;
 8     float c = 2.1f , d = 1.2f;
 9     cout<<"a + b = "<<a+b<<endl;
10     cout<<"c + d = "<<c+d<<endl;
11     return 0;
12 }

我们观察一下汇编代码:
在这里插入图片描述

可以很容易观察到:
a + b 调用的是 _ZNSolsEi@plt
c + d 调用的是 _ZNSolsEf@plt
我们看到操作符 “+” 完成 float 和 int 两种类型的加法计算,这就是操作符重载了。这些内置类型的操作符重载已经实现过了

下面我们把上述例子改成C语言版本,然后观察其汇编代码,看 C 语言是否也实现了 + 的重载呢?
在这里插入图片描述

这下很容易观察到,C 语言只是将两个变量先放到寄存器里面,然后再做加法运算,与运算符重载没有半毛钱关系,我们要记住的是,C 语言是不可能实现重载的


对于上面的问题二,模板的重载到底是怎样的?下面让我们简单例子了解一下,模板的重载是怎样实现的。

#include <iostream>
#include <cstdio>
using namespace std;
template <typename T>
void myswap(T &a, T &b)
{
	T c = 0;
	c = a;
	a = b;
	b = c;
	cout << "hello ....我是模板函数 欢迎 calll 我" << endl;
}
 
int main()
{
	
	int x = 10; 
	int y = 20;
	myswap<int>(x, y); //1 函数模板 显示类型 调用
	printf("x:%d y:%d \n", x, y);



	char a = 'a'; 
	char b = 'b';
	myswap<char>(a, b); //1 函数模板 显示类型 调用
	printf("a:%c b:%c \n", a, b);
	return 0;
}

在这里插入图片描述

我们从汇编代码可以观察出,在调用模板的时候,会把相应的参数进行替换在进行编译
那么我们可以得出函数模板机制结论

  • 编译器并不是把函数模板处理成能够处理任意类的函数
  • 编译器从函数模板通过具体类型产生不同的函数
  • 编译器会对函数模板进行两次编译
  • 在声明的地方对模板代码进行编译,在调用的地方对参数替换后的代码进行编译

附录:一种C++函数重载机制

附录:一种C++函数重载机制
这个机制是由张素琴等人提出并实现的,他们写了一个C++的编译系统COC++(开发在国产机上,UNIX操作系统环境下具有中国自己版权的C、C++和FORTRAN语言编译系统,这些编译系统分别满足了ISOC90、AT&T的C++85和ISOFORTRAN90标准)。COC++中的函数重载处理过程主要包括两个子过程:

  • 在函数声明时的处理过程中,编译系统建立函数声明原型链表,按照换名规则进行换名并在函数声明原型链表中记录函数换名后的名字(换名规则跟本文上面描述的差不多
    在这里插入图片描述
    图附1、过程1-建立函数链表(说明,函数名的编码格式为:<原函数名>_<作用域换名><函数参数表编码>,这跟g++中的有点不一样)
  • 在函数调用语句翻译过程中,访问符号表,查找相应函数声明原型链表,按照类型匹配原则,查找最优匹配函数节点,并输出换名后的名字下面给出两个子过程的算法建立函数声明原型链表算法流程如图附1,函数调用语句翻译算法流程如图附2。
    在这里插入图片描述
    附-模板函数和普通函数构成的重载,调用时又是如何匹配的呢?
    下面是C++创始人Bjarne Stroustrup的回答:
  • Find the set of function template specializations that will take part in overload resolution.
  • if two template functions can be called and one is more specified than the other, consider only the most specialized template function in the following steps.
  • Do overload resolution for this set of functions, plus any ordinary functions as for ordinary functions.
  • If a function and a specialization are equally good matches, the function is perferred.
  • If no match is found, the call is an error.
  • 18
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值