C++中的函数对象(Function Object)

转载地址:http://blog.csdn.net/bonchoix/article/details/8050627              http://blog.csdn.net/bonchoix/article/details/8054639


  一个函数对象,即一个重载了括号操作符“()”的对象。当用该对象调用此操作符时,其表现形式如同普通函数调用一般,因此取名叫函数对象。举个最简单的例子:

  1. class FuncObjType  
  2. {  
  3. public:  
  4.     void operator() ()  
  5.     {  
  6.         cout<<"Hello C++!"<<endl;  
  7.     }  
  8. };  

类FuncObjType中重载了“()”操作符,因此对于一个该类的对象FuncObjType val,可以这样调用该操作符:val()。调用结果即输出以上代码中的内容。该调用语句在形式上跟以下函数的调用完全一样:
  1. void val()  
  2. {  
  3.     cout<<"Hello C++!"<<endl;  
  4. }  

 

       既然用函数对象与调用普通函数有相同的效果,为什么还有搞这么麻烦定义一个类来使用函数对象?主要在于函数对象有以下的优势:

       1. 函数对象可以有自己的状态。我们可以在类中定义状态变量,这样一个函数对象在多次的调用中可以共享这个状态。但是函数调用没这种优势,除非它使用全局变量来保存状态。呃,面向对象编程。。。全局变量。。。。惊讶

       2. 函数对象有自己特有的类型,而普通函数无类型可言。这种特性对于使用C++标准库来说是至关重要的。这样我们在使用STL中的函数时,可以传递相应的类型作为参数来实例化相应的模板,从而实现我们自己定义的规则。比如自定义容器的排序规则。

 

       举几个使用函数对象的典型的例子:

       第一个即自定义容器set对字符串string的排序规则。首先来定义相应的类并重载 “()” 来规定排序(这里我们按从大到小排序),

  1. class StringSort  
  2. {  
  3. public:  
  4.     bool operator() (const string &str1, const string &str2) const  
  5.     {  
  6.         return str1 > str2;  
  7.     }  
  8. };  

然后我们可以用这个类作为参数来初始化set容器:

  1. set<string,StringSort> myset;  
  2. myset.insert("A");  
  3. myset.insert("B");  

这样容器内容输出为:“B“,”A",而不是默认情况下的"A","B"。

       再举一个实用到内部状态的函数对象的例子。设想我们通过一个函数对象来产生一串连续的数字,可以任意规定起始数字,每调用一次,将返回下一个数字。相应的类可以如下设计:

  1. class SuccessiveNumGen  
  2. {  
  3. public:  
  4.     SuccessiveNumGen(int origin = 0):m_origin(origin){}  
  5.     int operator() ()  
  6.     {  
  7.         return m_origin++;  
  8.     }  
  9. private:  
  10.     int m_origin;  
  11. };  

为了测试,我们用到一个标准库函数:generate_n。这个函数自动调用我们传进去的函数对象n次,并将结果保存到指定的起始迭代器处。如下:

  1. vector<int> dest;  
  2. generate_n(back_inserter(dest),10,SuccessiveNumGen(3));  

这里我们用dest来存放数字,初始化了一个函数对象SuccessiveNumGen(3),即起始数字为3。generate_n函数自动调用10次,结果存放在dest容器中。这里还用到了back_inserter函数,这是个函数适配器,它返回一个函数对象,能保证每次将结果放到容器dest的尾部。 函数适配器在后面会介绍,这里不再多说。我们只当它提供了我们存放数字的位置即可(切不可直接使用dest.end()!)。这样,最终容器中的内容为 3,4,5,6,……,12。通过使用不同的起始数字来初始化不同的函数对象,可以生成不同的数字序列。
      

       此外,函数对象还有一个非常重要的用途,即作为谓词函数(Predicate)。谓词函数通常用来对传进来的参数进行判断,并返回布尔值。标准库中有大量的函数都定义了多个重载版本,其中包含由用户提供谓词函数的,比如:find_if,remove_if,等等。现在假设我们有一串数字,要从中找出第一个不小于10的数字。可以定义如下相应的类:

  1. class NoLess  
  2. {  
  3. public:  
  4.     NoLess(int min = 0):m_min(min){}  
  5.     bool operator() (int value) const  
  6.     {  
  7.         return value >= m_min;  
  8.     }  
  9.       
  10. private:  
  11.     int m_min;  
  12. };  

从而这样调用 find_if函数:find_if(dest.begin(),dest.end(),NoLess(10))即可,该函数返回第一个令函数对象返回true的值的位置(在这个例子中即10对应的迭代器位置)。

 

       有一点需要指出的是,在调用用到函数对象的标准库算法时,除非显式地指定模板类型为“传引用”,否则默认情况下函数对象是”按值传递“的!因此,如果传递的是一个具有内部状态的函数对象,则被改变状态的是函数内部被复制的临时对象,函数结束后随之消失。真正传进来的函数对象状态并为改变。我们写个简单的测试程序来验证下,这个例子中我们来查找数字序列中的第3个数字:

  1. class Nth  
  2. {  
  3. public:  
  4.     Nth(int n=0):m_nth(n),m_count(1){}  
  5.     bool operator() (int)  
  6.     {  
  7.         return m_count++ == m_nth;  
  8.     }  
  9.       
  10.     int GetCount()const  
  11.     {  
  12.         return m_count;  
  13.     }  
  14.       
  15. private:  
  16.     int m_nth;  
  17.     int m_count;  
  18. };  

测试如下:

  1. Nth nth(3);  
  2. vector<int>::iterator nthItr = find_if(dest.begin(),dest.end(),nth);  //dest内容为连续数字:3,4,5,6,……,12  
  3. cout<<"3rd:"<<*nthItr<<endl;  
  4. cout<<"State:"<<nth.GetCount()<<endl;  

输出结果为,确实能找到第三个数字(5),但查看nth的状态时,返回的m_count依然为0。说明nth确实未被修改。

       一般情况下,至于是传值还是传引用,不会对我们造成太多影响。但还是有必要清楚这一点,困为有时候针对特定的实现会出现一些莫名其妙的问题,以下面的例子来说明:

       我们通过remove_if函数来删除一个数字序列中的第3个数字,如下:

  1. vector<int> vec;  
  2. for(vector<int>::size_type i=0; i<10; ++i)  
  3.     vec.push_back(i+1);  
  4.   
  5. Nth nth(3);  
  6.   
  7. remove_if(vec.begin(),vec.end(),nth);  
  8.       
  9. for(vector<int>::size_type i=0; i<10; ++i)  
  10. {  
  11.     cout<<vec[i]<<endl;  
  12. }  

按正常思路来讲,删除第3个元素后输出应该是:1,2,4,5,6,7,8,9,10,10(至于最后为什么会出现两次10,这跟标准算法库设计思想有关:算法库绝不改变容器的大小!所谓的remove只是概念上的remove,被删的元素被丢到了后面,可以通过返回值来确定位置。标准算法库以后会进行说明,不是这部分的重点)。但实际情况却令人吃惊:1,2,4,5,7,8,9,10,9,10。

造成这种现象的原因与标准库的实现有关,在《The C++ Standard Library, A tutorial and reference》这本书上,作者给出一种造成这种情况的可能的实现:

  1. template <class ForwIter, class Predicate>  
  2. ForwIter remove_if(ForwIter beg, ForwIter end, Predicate op)  
  3. {  
  4.     beg = std::find_if(beg, end, op);  
  5.     if (beg == end)   
  6.     {  
  7.         return beg;  
  8.     }  
  9.     else   
  10.     {  
  11.         ForwIter next = beg;  
  12.         return remove_copy_if(++next, end, beg, op);  
  13.     }  
  14. }  

在这个实现中,我们清晰地看出,函数对象op两次作为参数传递到find_if和remove_copy_if函数中,正是由于标准库默认的"按值传递”,导致两次传递进来的op都是最初始的状态,即m_count为0!这样一来,传递到remove_if函数中的op将从+next位置(next是第一次找到的将被删除的第三个位置)算起再次删除第三个元素,于是第六个元素也就被删除了。

此外,C++参考手册网站C++参考手册上提供的是这样一种可能的实现:

  1. template<class ForwardIt, class UnaryPredicate>  
  2. ForwardIt remove_if(ForwardIt first, ForwardIt last,   
  3.                           UnaryPredicate p)  
  4. {  
  5.     ForwardIt result = first;  
  6.     for (; first != last; ++first) {  
  7.         if (!p(*first)) {  
  8.             *result++ = *first;  
  9.         }  
  10.     }  
  11.     return result;  
  12. }  

显然,这种实现则不会造成删除两次的情况,经过我的测试,结果确实是我们想要的:1,2,4,5,6,7,8,9,10,10。

       可见,不是所有的返回布尔值的函数对象都适合作为谓词函数,比如这个例子,不同标准库具体的实现会造成不同的结果。因此,作为一个好的编程习惯,用作谓词函数的函数对象,其判断结果最好不要依赖内部变动的状态。

除了自定义的函数对象,标准库还为我们提供了一系列现成的函数对象, 比如常见的数学、逻辑运算等。例如:negate<type>(),plus<type>(),minus<type>(),multiplies<type>(),divides<type>(),modulus<type>(),equal_to<type>,greater<type>(),less<type>(),logical_not<type>(),logical_and<type>(),等等。
       关于函数对象的最后一个很重要的概念是“函数适配器”。函数适配器,本质上讲也是一个函数对象。这个函数对象通过将一个或多个函数对象或者特定的数据按一定规则组合起来,以完成某些特定的功能。标准库为我们提供了几种函数适配器,例如:通过bind1st和bind2nd两个包装函数即可返回相应的适配器,这两个函数各有两个形参,分别为二元函数对象和一个数值,适配器自动把数值赋给函数对象的第1个(bind1st)或第2个(bind2nd)参数,并返回一个一元的函数对象。例如以下语句:

  1. find_if(vec.begin(),vec.end(),bind2nd(modulus<int>(),2));  
modulus<int>()初始化一个二元的函数对象,bind2nd函数把‘2’赋予其第二个参数,返回一个一元函数对象,即判断一个整数是否为偶数。这个语句的目的即找出容器vec中第一个偶数。
       注意:不要误把bind1st和bind2nd当成是函数适配器,它们仅仅是两个普通的包装函数模板,它们返回的才是真正的函数适配器。对应的函数对象类型分别为binder1st和binder2nd。这两个函数模板实现如下所示:
  1. template<typename Operation,typename T>  
  2. binder1st bind1st(const Operation &op, const T &t)  
  3. {  
  4.     return binder1st<Operation>(op,typename Operation::first_argument_type(t));  
  5. }  
  1. template<typename Operation,typename T>  
  2. binder1st bind2nd(const Operation &op, const T &t)  
  3. {  
  4.     return binder2nd<Operation>(op,typename Operation::second_argument_type(t));  
  5. }  
先不管具体细节,后面马上会说到。我们只关注函数的实现,很容易看出返回的分别是类binder1st<Operation>和binder2nd<Operation>的对象,即我们所说的函数适配器。
       除了这两个函数适配器,标准库中还定义了两个"取反器",分别可以通过调用辅助函数not1和not2来获得,即unary_negate<type>和binary_negate<type>。此外,包装函数模板mem_func_ref返回的适配器用于自动调用对象的成员函数,具体细节及其他适配器可以到C++参考网站查看。
       函数适配器是C++中一个强有力的工具,它允许我们针对多个函数对象按照需要进行任意组合,来产生意义丰富的表达式。这种方法被称为"function composition"。比如对于函数f(x),g(x),h(x,y),对他们进行组合,可以生成f(g(x)),g(f(x)),h(f(x),g(x))等复杂的函数。这里f,g分别对应了一元函数对象,h对应了二元函数对象,组合函数可以认为是函数适配器。
       不幸的是,标准库并没有给我们提供太多的适配器。因此,想要很好地利用它,还需要我们自己来定义。我们已经知道,自定义函数对象是件很容易的事情,但是想要让函数对象能在适配器中进行组合,则需要额外的一些工作。为了方便我们创建能在适配器中运用的函数对象,标准库定义了两个有用的结构,分别为:
  1. template <class Arg, class Result>  
  2. struct unary_function  
  3. {  
  4.     typedef Arg argument_type;  
  5.     typedef Result result_type;  
  6. };  
  1. template <class Arg1, class Arg2, class Result>  
  2. struct binary_function  
  3. {  
  4.     typedef Arg1 first_argument_type;  
  5.     typedef Arg2 second_argument_type;  
  6.     typedef Result result_type;  
  7. };  
这两个结构定义了几个类型成员,来表示函数对象参数和返回值的类型。其中unary_function代表一元函数对象,binary_function代表二元函数对象。通过让我们自定义的函数对象继承相应的结构,即可在函数适配器中使用。标准库的函数对象正是这样设计的,我们拿适配器binder1st作为例子来说明下,类binder1st如下:
  1. template<class Operation>  
  2. class binder1st: public unary_function<typename Operation::second_argument_type, typename Operation::return_type>  
  3. {  
  4. public:  
  5.     binder1st(const Operation &op, const typename Operation::first_argument_type &arg): operation(op),arg_1st(arg) {}  
  6.     typename Operation::return_type operator() (const typename Operation::second_argument_type &arg_2nd) const  
  7.     {  
  8.         return operation(arg_1st,arg_2nd);  
  9.     }  
  10.               
  11. private:  
  12.     Operation operation;  
  13.     typename Operation::first_argument_type arg_1st;  
  14. };  
适配器通过接受一个二元的函数对象(Operation)和一个该二元函数对象第一个参数类型的值(arg)调用构造函数。在其重载的"()"操作符函数中,只接受一个参数,对应其基类unary_function的argument_type,返回类型为unary_function的return_type。类定义中频繁用到了typename Operation::first_argument、typename Operation::second_argument_type及typename Operation::result_type,充分说明了对Operation的要求,只要Operation继承了binary_function即可。我们以一个计算pow(x,y)的函数对象为例子演示一下:
  1. template<typename T1, typename T2>  
  2. class Pow: public binary_function<T1,T2,T1>  
  3. {  
  4. public:  
  5.     T1 operator() (T1 base, T2 exp) const  
  6.     {  
  7.         return std::pow(base,exp);  
  8.     }  
  9. };  
比如我们需要一个计算任意数字立方的函数对象,即可通过bind2nd(Pow<float,int>(),3)来得到。
       最后,我们通过自定义一个函数适配器来结束本文。要实现的功能为: h(f(x),g(x))。首先这是个一元的函数对象,只接受一个参数x,它组合了三个函数对象H,F,G。可以这样来实现:
  1. template<typename H,typename F,typename G>  
  2. class MyAdapter: unary_function<typename F::argument_type, typename H::return_type>  
  3. {  
  4. public:  
  5.     MyAdapter(const H &h, const F &f, const G &g):m_h(h),m_f(f),m_g(g) {}  
  6.     typename H::return_type operator() (const typename F::argument_type &x) const  
  7.     {  
  8.         return m_h(m_f(x),m_g(x));  
  9.     }  
  10.               
  11. private:  
  12.     H m_h;  
  13.     F m_f;  
  14.     G m_g;  
  15. }; 


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值