可变参数表的用法 stdarg

最新推荐文章于 2022-02-03 21:39:27 发布

pengfoo

最新推荐文章于 2022-02-03 21:39:27 发布

阅读量784

点赞数 2

分类专栏：技术联盟文章标签： list 编译器 null fun 平台数据结构

技术联盟专栏收录该内容

53 篇文章 0 订阅

订阅专栏

2010年08月25日星期三上午 00:06

转载自 ___yiren___

最终编辑 jrckkyy

一、

printf ( "I love you" );
printf ( "%d", a );
printf ( "%d,%d", a, b );

　　第一、二、三个printf分别接受1、2、3个参数，让我们看看printf函数的原型：

int printf ( const char *format, ... );

　　从函数原型可以看出，其除了接收一个固定的参数format以外，后面的参数用"…"表示。在C/C++语言中，"…"表示可以接受不定数量的参数，理论上来讲，可以是0或0以上的n个参数。

　　本文将对C/C++可变参数表的使用方法及C/C++支持可变参数表的深层机理进行探索。

　　可变参数表的用法

　　1、相关宏

　　标准C/C++包含头文件stdarg.h，该头文件中定义了如下三个宏：

void va_start ( va_list arg_ptr, prev_param ); /* ANSI version */
type va_arg ( va_list arg_ptr, type );
void va_end ( va_list arg_ptr );

　　在这些宏中，va就是variable argument(可变参数)的意思；arg_ptr是指向可变参数表的指针；prev_param则指可变参数表的前一个固定参数；type为可变参数的类型。va_list也是一个宏，其定义为typedef char * va_list，实质上是一char型指针。char型指针的特点是++、--操作对其作用的结果是增1和减1（因为sizeof(char)为1），与之不同的是int等其它类型指针的++、--操作对其作用的结果是增sizeof(type)或减sizeof(type)，而且sizeof(type)大于1。

　　通过va_start宏我们可以取得可变参数表的首指针，这个宏的定义为：

#define va_start ( ap, v ) ( ap = (va_list)&v + _INTSIZEOF(v) )

　　显而易见，其含义为将最后那个固定参数的地址加上可变参数对其的偏移后赋值给ap，这样ap就是可变参数表的首地址。其中的_INTSIZEOF宏定义为：

#define _INTSIZEOF(n) ((sizeof ( n ) + sizeof ( int ) - 1 ) & ~( sizeof( int ) - 1 ) )

　　va_arg宏的意思则指取出当前arg_ptr所指的可变参数并将ap指针指向下一可变参数，其原型为：

#define va_arg(list, mode) ((mode *)(list =\
(char *) ((((int)list + (__builtin_alignof(mode)<=4?3:7)) &\
(__builtin_alignof(mode)<=4?-4:-8))+sizeof(mode))))[-1]

　　对这个宏的具体含义我们将在后面深入讨论。

　　而va_end宏被用来结束可变参数的获取，其定义为：

#define va_end ( list )

　　可以看出，va_end ( list )实际上被定义为空，没有任何真实对应的代码，用于代码对称，与va_start对应；另外，它还可能发挥代码的"自注释"作用。所谓代码的"自注释"，指的是代码能自己注释自己。

　　下面我们以具体的例子来说明以上三个宏的使用方法。

　　2、一个简单的例子

#include <stdarg.h>
/*　函数名：max
*　功能：返回n个整数中的最大值
* 参数：num：整数的个数 ...：num个输入的整数
* 返回值：求得的最大整数
*/
int max ( int num, ... )
{
　int m = -0x7FFFFFFF; /* 32系统中最小的整数 */
　va_list ap;
　va_start ( ap, num );
　for ( int i= 0; i< num; i++ )
　{
　　int t = va_arg (ap, int);
　　if ( t > m )
　　{
　　　m = t;
　　}
　}
　va_end (ap);
　return m;
}
/* 主函数调用max */
int main ( int argc, char* argv[] )
{
　int n = max ( 5, 5, 6 ,3 ,8 ,5); /* 求5个整数中的最大值 */
　cout << n;
　return 0;
}

　　函数max中首先定义了可变参数表指针ap，而后通过va_start ( ap, num )取得了参数表首地址（赋给了ap），其后的for循环则用来遍历可变参数表。这种遍历方式与我们在数据结构教材中经常看到的遍历方式是类似的。

　　函数max看起来简洁明了，但是实际上printf的实现却远比这复杂。max函数之所以看起来简单，是因为：

　　(1) max函数可变参数表的长度是已知的，通过num参数传入；

　　(2) max函数可变参数表中参数的类型是已知的，都为int型。

　　而printf函数则没有这么幸运。首先，printf函数可变参数的个数不能轻易的得到，而可变参数的类型也不是固定的，需由格式字符串进行识别（由%f、%d、%s等确定），因此则涉及到可变参数表的更复杂应用。

二、写一个简单的可变参数的C函数
先看例子程序。该函数至少有一个整数参数,其后占位符…，表示后面参数的个数不定. 在这个例子里，所有的输入参数必须都是整数，函数的功能只是打印所有参数的值.
函数代码如下：
//示例代码1：可变参数函数的使用
#include "stdio.h"
#include "stdarg.h"
void simple_va_fun(int start, ...)
{
     va_list arg_ptr;
     int nArgValue =start;
     int nArgCout=0;      //可变参数的数目
     va_start(arg_ptr,start); //以固定参数的地址为起点确定变参的内存起始地址。
     do {
        ++nArgCout;
         printf("the %d th arg: %d\n",nArgCout,nArgValue);      //输出各参数的值
         nArgValue = va_arg(arg_ptr,int);                     //得到下一个可变参数的值
     } while(nArgValue != -1);
     return;
}
int main(int argc, char* argv[])
{
     simple_va_fun(100,-1);
     simple_va_fun(100,200,-1);
     return 0;
}

下面解释一下这些代码

从这个函数的实现可以看到,我们使用可变参数应该有以下步骤:

⑴由于在程序中将用到以下这些宏:
     void va_start( va_list arg_ptr, prev_param );
     type va_arg( va_list arg_ptr, type );
     void va_end( va_list arg_ptr );
va在这里是variable-argument(可变参数)的意思.
这些宏定义在stdarg.h中,所以用到可变参数的程序应该包含这个头文件.

⑵函数里首先定义一个va_list型的变量,这里是arg_ptr,这个变量是存储参数地址的指针.因为得到参数的地址之后，再结合参数的类型，才能得到参数的值。

⑶然后用va_start宏初始化⑵中定义的变量arg_ptr,这个宏的第二个参数是可变参数列表的前一个参数,即最后一个固定参数.

⑷然后依次用va_arg宏使arg_ptr返回可变参数的地址,得到这个地址之后，结合参数的类型，就可以得到参数的值。

⑸设定结束条件，这里的条件就是判断参数值是否为-1。注意被调的函数在调用时是不知道可变参数的正确数目的，程序员必须自己在代码中指明结束条件。至于为什么它不会知道参数的数目，读者在看完这几个宏的内部实现机制后，自然就会明白。

(二)可变参数在编译器中的处理
我们知道va_start,va_arg,va_end是在stdarg.h中被定义成宏的, 由于1)硬件平台的不同 2)编译器的不同,所以定义的宏也有所不同,下面看一下VC++6.0中stdarg.h里的代码（文件的路径为VC安装目录下的\vc98\include\stdarg.h）
     typedef char *   va_list;
     #define _INTSIZEOF(n) ((sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
     #define va_start(ap,v)   ( ap = (va_list)&v + _INTSIZEOF(v) )
     #define va_arg(ap,t)     ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
     #define va_end(ap)       ( ap = (va_list)0 )

下面我们解释这些代码的含义：

1、首先把va_list被定义成char*，这是因为在我们目前所用的PC机上，字符指针类型可以用来存储内存单元地址。而在有的机器上va_list是被定义成void*的

2、定义_INTSIZEOF(n)主要是为了某些需要内存的对齐的系统.这个宏的目的是为了得到最后一个固定参数的实际内存大小。在我的机器上直接用sizeof运算符来代替，对程序的运行结构也没有影响。（后文将看到我自己的实现）。

3、va_start的定义为 &v+_INTSIZEOF(v) ,这里&v是最后一个固定参数的起始地址，再加上其实际占用大小后，就得到了第一个可变参数的起始内存地址。所以我们运行va_start(ap, v)以后,ap指向第一个可变参数在的内存地址,有了这个地址，以后的事情就简单了。

这里要知道两个事情：
     ⑴在intel+windows的机器上，函数栈的方向是向下的，栈顶指针的内存地址低于栈底指针，所以先进栈的数据是存放在内存的高地址处。
     (2)在VC等绝大多数C编译器中，默认情况下，参数进栈的顺序是由右向左的，因此，参数进栈以后的内存模型如下图所示：最后一个固定参数的地址位于第一个可变参数之下，并且是连续存储的。
|--------------------------|
|   最后一个可变参数              |    ->高内存地址处
|--------------------------|
|--------------------------|
|   第N个可变参数               |      ->va_arg(arg_ptr,int)后arg_ptr所指的地方,
|                                |      即第N个可变参数的地址。
|--------------- |
|--------------------------|
|   第一个可变参数                |      ->va_start(arg_ptr,start)后arg_ptr所指的地方
|                                |      即第一个可变参数的地址
|--------------- |
|------------------------ --|
|                                |
|   最后一个固定参数              |     -> start的起始地址
|-------------- -|        .................
|-------------------------- |
|                                |
|--------------- |   -> 低内存地址处

(4) va_arg():有了va_start的良好基础，我们取得了第一个可变参数的地址，在va_arg()里的任务就是根据指定的参数类型取得本参数的值，并且把指针调到下一个参数的起始地址。
因此，现在再来看va_arg()的实现就应该心中有数了：
     #define va_arg(ap,t)     ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
这个宏做了两个事情，
    ①用用户输入的类型名对参数地址进行强制类型转换，得到用户所需要的值
    ②计算出本参数的实际大小，将指针调到本参数的结尾，也就是下一个参数的首地址，以便后续处理。

(5)va_end宏的解释：x86平台定义为ap=(char*)0;使ap不再指向堆栈,而是跟NULL一样.有些直接定义为((void*)0),这样编译器不会为va_end产生代码,例如gcc在linux的x86平台就是这样定义的. 在这里大家要注意一个问题:由于参数的地址用于va_start宏,所以参数不能声明为寄存器变量或作为函数或数组类型. 关于va_start, va_arg, va_end的描述就是这些了,我们要注意的是不同的操作系统和硬件平台的定义有些不同,但原理却是相似的.

(三)可变参数在编程中要注意的问题
因为va_start, va_arg, va_end等定义成宏,所以它显得很愚蠢, 可变参数的类型和个数完全在该函数中由程序代码控制,它并不能智能地识别不同参数的个数和类型. 有人会问:那么printf中不是实现了智能识别参数吗?那是因为函数 printf是从固定参数format字符串来分析出参数的类型,再调用va_arg 的来获取可变参数的.也就是说,你想实现智能识别可变参数的话是要通过在自己的程序里作判断来实现的. 例如，在C的经典教材《the c programming language》的7.3节中就给出了一个printf的可能实现方式，由于篇幅原因这里不再叙述。

（四）小结:
1、标准C库的中的三个宏的作用只是用来确定可变参数列表中每个参数的内存地址，编译器是不知道参数的实际数目的。
2、在实际应用的代码中，程序员必须自己考虑确定参数数目的办法，如
⑴在固定参数中设标志-- printf函数就是用这个办法。后面也有例子。
⑵在预先设定一个特殊的结束标记，就是说多输入一个可变参数，调用时要将最后一个可变参数的值设置成这个特殊的值，在函数体中根据这个值判断是否达到参数的结尾。本文前面的代码就是采用这个办法.
无论采用哪种办法，程序员都应该在文档中告诉调用者自己的约定。
3、实现可变参数的要点就是想办法取得每个参数的地址，取得地址的办法由以下几个因素决定：
①函数栈的生长方向
②参数的入栈顺序
③CPU的对齐方式
④内存地址的表达方式
结合源代码，我们可以看出va_list的实现是由④决定的，_INTSIZEOF(n)的引入则是由③决定的，他和①②又一起决定了va_start的实现，最后va_end的存在则是良好编程风格的体现，将不再使用的指针设为NULL,这样可以防止以后的误操作。
4、取得地址后，再结合参数的类型，程序员就可以正确的处理参数了。理解了以上要点，相信稍有经验的读者就可以写出适合于自己机器的实现来。下面就是一个例子

（五）扩展--自己实现简单的可变参数的函数。
下面是一个简单的printf函数的实现，参考了<The C Programming Language>中的156页的例子，读者可以结合书上的代码与本文参照。
#include "stdio.h"
#include "stdlib.h"
void myprintf(char* fmt, ...)         //一个简单的类似于printf的实现，//参数必须都是int 类型
{
     char* pArg=NULL;                //等价于原来的va_list
     char c;
     pArg = (char*) &fmt;     //注意不要写成p = fmt !!因为这里要对//参数取址，而不是取值
     pArg += sizeof(fmt);          //等价于原来的va_start
    do
     {
         c =*fmt;
         if (c != ’%’)
         {
             putchar(c);             //照原样输出字符
         }
         else
{
//按格式字符输出数据
             switch(*++fmt)
{
             case ’d’:
                 printf("%d",*((int*)pArg));
                 break;
             case ’x’:
                 printf("%#x",*((int*)pArg));
                 break;
             default:
                 break;
             }
             pArg += sizeof(int);                //等价于原来的va_arg
         }
         ++fmt;
     }while (*fmt != ’\0’);
     pArg = NULL;                                //等价于va_end
     return; }
int main(int argc, char* argv[])
{
     int i = 1234;
     int j = 5678;
     myprintf("the first test:i=%d\n",i,j);
     myprintf("the secend test:i=%d; %x;j=%d;\n",i,0xabcd,j);
     system("pause");
     return 0;
}
在intel+win2k+vc6的机器执行结果如下：
the first test:i=1234
the secend test:i=1234; 0xabcd;j=5678;

pengfoo

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
可变参数表的用法 stdarg

2010年08月25日星期三上午 00:06转载自 ___yiren___最终编辑 jrckkyy一、 printf ( "I love you" ); printf ( "%d", a );printf ( "%d,%d", a, b );　　第一、二、三个printf分别接受1、2、3个参数，让我们看看prin
复制链接

扫一扫