自己写的仿fprintf()函数和可变参数函数浅析
编辑程序绝不是一件简单的事情,我也是如此。因为c语言的强大之处,所以我觉得即使是一年前学的c语言,我还是对于有些语法难以解释的清。而正因为难以解释的清,我在开始一个项目的时候本认为可以顺利的完成的,结果时间拖了又拖,最后还是没有完成。
这个周末我一直在研究怎样写一个属性脚本系统。这个脚本系统主要是实现用文本文件来控制程序的某些参数。现在还没有完成。我的思路是能够快速地通过脚本文件对程序中的参数进行赋值。结果我又考虑程序的实用性,就想到了使用可变参数函数的部分。第一个能使我想到的可变函数就是printf()函数。这个函数能将格式化的数字传送到字符串中,并且输出。这是多么的神奇啊。美好的东西总是引起我们的好奇。这不前两天我就开始着手研究printf()函数的实现机理。
对c/c++入门的人一定知道可变参数函数。这种函数的特征有二:第一是至少有一个固定参数,第二,可变参数部分总是在固定参数的后面。如我写的函数:
bool PutValue( const char* fmt, ... );
就是这样一种可变参数函数。高手们可定能够熟练地使用va_start()、va_arg()和va_end()宏了,因为他们是可变参数的“三剑客”。有了它们,稍微有些c语言知识就能够编出高效的可变参数函数了。但我还是不知足,我要了解这些宏的实现原理。现在把stdarg.h中的相关定义展示给大家。
- typedef char *va_list;
- #define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
- #define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )
- #define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
- #define va_end(ap) ( ap = (va_list)0 )
从中看出,这些宏有些生涩难懂。我都是在复习了c语言位运算和原码、补码知识后才看得懂的。如果大家感兴趣的话,可以看看相关的知识。
然后我们知道,使用windows操作系统和intel的CPU,栈是自顶向下的。也就是说栈顶在低位地址,栈底在高位地址。在传递参数的时候,通过调用默认的调用规范__cdecl,参数的传递顺序是从右到左。最终的结果是最左边第一个参数处于最低地址处,最右边最后一个参数处于最高的地址处。而使用...编译器又不会报错。于是我们想可不可以通过第一个参数的地址找到所有的参数呢?答案是肯定的。
但是我在这里遇到一个难以解决的问题:对于float类型参数似乎不起作用。因为得出的不是我想要的答案。这又该如何解决呢?我在网上查到了相关的问题,原来是char、short、float得到了提升,也就是“加宽”。因为intel的CPU的栈元素统一是sizeof(int)字节长。也就是4字节。所以小于4字节的char、short都被提升至4字节了,为了访问的方便。而同样是4字节的float由于某种特殊的考量(其实我也不知道是为什么,可能是提高精度吧。),被提升至了double,也就是8字节的水平。所以在内存中float型占用的空间是8字节。
使用了VS的调试器查看了内存,并且翻了汇编语言程序设计的IEEE浮点数存储方式,基本上验证我的猜想。于是我对计算机组成原理有了全新的认识(不过我们还没有上这门课)。下面我就用一个小小的实例来演示可变参数函数的使用(使用的是VS2005编译器,XP系统):
- #include <iostream>
- using namespace std;
- void fun(int a, /*float b, float c, float d, float e*/... )
- {
- int *temp2 = &a + 1;
- //cout<<&b<<'/n';
- //cout<<&c<<'/n';
- //cout<<&d<<'/n';
- //cout<<&e<<'/n';
- cout<<"Temp2="<<temp2<<'/n';
- //( double* )temp;
- //float* temp = ( float* )temp2 - 1;
- //temp = &b, cout<<*temp<<'/n';
- //temp = &c, cout<<*temp<<'/n';
- //temp = &d, cout<<*temp<<'/n';
- //temp = &e, cout<<*temp<<'/n';
- double* temp3 = ( double* )temp2;
- for (int i = 0; i < a; ++i )
- {
- cout <<*temp3 << endl;
- temp3++;
- }
- }
- int main()
- {
- float a = 1.06f;
- float b = 77.03f;
- float c = 63.04f;
- float d = 94.05f;
- fun(4, a, b, c, d);
- //system("pause");
- return 0;
- }
程序的截图如下图所示:
如果大家想深入研究的话,可以将注释去掉,这样能显示更多的内容。
那么printf()是怎么实现的呢?
大家应该猜出来了。printf()函数是靠“%”来对传入的参数个数进行统计的。这并不意味着它能够检测出你的参数个数是否和“%”个数保持一致。如果有这样一个语句:
MyPrintf( "%d,%f,%c", a, b );
且没有引入异常处理机制,那么它的后果是未知的,因为它访问了不该访问的区域。
讲到这里我应该把自己的仿fprintf()函数给大家展示一下了。这个函数有些长,主要是判断类型用了不少语句,但是这个程序能基本与printf()函数的格式说明一致,我只好这么做了。下面我说明一下各个格式标识符的意思: