自己写的仿fprintf()函数和可变参数函数浅析

最新推荐文章于 2023-08-10 20:13:41 发布

iteye_13202

最新推荐文章于 2023-08-10 20:13:41 发布

阅读量197

点赞数

文章标签： c/c++ 操作系统

自己写的仿fprintf()函数和可变参数函数浅析
编辑程序绝不是一件简单的事情，我也是如此。因为c语言的强大之处，所以我觉得即使是一年前学的c语言，我还是对于有些语法难以解释的清。而正因为难以解释的清，我在开始一个项目的时候本认为可以顺利的完成的，结果时间拖了又拖，最后还是没有完成。
这个周末我一直在研究怎样写一个属性脚本系统。这个脚本系统主要是实现用文本文件来控制程序的某些参数。现在还没有完成。我的思路是能够快速地通过脚本文件对程序中的参数进行赋值。结果我又考虑程序的实用性，就想到了使用可变参数函数的部分。第一个能使我想到的可变函数就是printf()函数。这个函数能将格式化的数字传送到字符串中，并且输出。这是多么的神奇啊。美好的东西总是引起我们的好奇。这不前两天我就开始着手研究printf()函数的实现机理。
对c/c++入门的人一定知道可变参数函数。这种函数的特征有二：第一是至少有一个固定参数，第二，可变参数部分总是在固定参数的后面。如我写的函数：
bool PutValue( const char* fmt, ... );
就是这样一种可变参数函数。高手们可定能够熟练地使用va_start()、va_arg()和va_end()宏了，因为他们是可变参数的“三剑客”。有了它们，稍微有些c语言知识就能够编出高效的可变参数函数了。但我还是不知足，我要了解这些宏的实现原理。现在把stdarg.h中的相关定义展示给大家。

Code:

typedefchar*va_list;
#define_INTSIZEOF(n)((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
#defineva_start(ap,v)(ap=(va_list)&v+_INTSIZEOF(v))
#defineva_arg(ap,t)(*(t*)((ap+=_INTSIZEOF(t))-_INTSIZEOF(t)))
#defineva_end(ap)(ap=(va_list)0)

从中看出，这些宏有些生涩难懂。我都是在复习了c语言位运算和原码、补码知识后才看得懂的。如果大家感兴趣的话，可以看看相关的知识。
然后我们知道，使用windows操作系统和intel的CPU，栈是自顶向下的。也就是说栈顶在低位地址，栈底在高位地址。在传递参数的时候，通过调用默认的调用规范__cdecl，参数的传递顺序是从右到左。最终的结果是最左边第一个参数处于最低地址处，最右边最后一个参数处于最高的地址处。而使用...编译器又不会报错。于是我们想可不可以通过第一个参数的地址找到所有的参数呢？答案是肯定的。
但是我在这里遇到一个难以解决的问题：对于float类型参数似乎不起作用。因为得出的不是我想要的答案。这又该如何解决呢？我在网上查到了相关的问题，原来是char、short、float得到了提升，也就是“加宽”。因为intel的CPU的栈元素统一是sizeof(int)字节长。也就是4字节。所以小于4字节的char、short都被提升至4字节了，为了访问的方便。而同样是4字节的float由于某种特殊的考量（其实我也不知道是为什么，可能是提高精度吧。），被提升至了double，也就是8字节的水平。所以在内存中float型占用的空间是8字节。
使用了VS的调试器查看了内存，并且翻了汇编语言程序设计的IEEE浮点数存储方式，基本上验证我的猜想。于是我对计算机组成原理有了全新的认识（不过我们还没有上这门课）。下面我就用一个小小的实例来演示可变参数函数的使用（使用的是VS2005编译器，XP系统）：

Code:

#include<iostream>
usingnamespacestd;
voidfun(inta,/*floatb,floatc,floatd,floate*/...)
{
int*temp2=&a+1;
//cout<<&b<<'/n';
//cout<<&c<<'/n';
//cout<<&d<<'/n';
//cout<<&e<<'/n';
cout<<"Temp2="<<temp2<<'/n';
//(double*)temp;
//float*temp=(float*)temp2-1;
//temp=&b,cout<<*temp<<'/n';
//temp=&c,cout<<*temp<<'/n';
//temp=&d,cout<<*temp<<'/n';
//temp=&e,cout<<*temp<<'/n';
double*temp3=(double*)temp2;
for(inti=0;i<a;++i)
{
cout<<*temp3<<endl;
temp3++;
}
}
intmain()
{
floata=1.06f;
floatb=77.03f;
floatc=63.04f;
floatd=94.05f;
fun(4,a,b,c,d);
//system("pause");
return0;
}

程序的截图如下图所示：
如果大家想深入研究的话，可以将注释去掉，这样能显示更多的内容。

那么printf()是怎么实现的呢？
大家应该猜出来了。printf()函数是靠“%”来对传入的参数个数进行统计的。这并不意味着它能够检测出你的参数个数是否和“%”个数保持一致。如果有这样一个语句：
MyPrintf( "%d,%f,%c", a, b );
且没有引入异常处理机制，那么它的后果是未知的，因为它访问了不该访问的区域。
讲到这里我应该把自己的仿fprintf()函数给大家展示一下了。这个函数有些长，主要是判断类型用了不少语句，但是这个程序能基本与printf()函数的格式说明一致，我只好这么做了。下面我说明一下各个格式标识符的意思：

%c 字符型（char）
%sd 有符号短整型（signed short）
%s 字符串型（char*）（未实现）
%us 无符号短整型（unsigned short）
%ui 无符号整型（unsigned int）
%ud 无符号整型（unsigned int）
%ul 无符号长整型（unsigned long）
%i 有符号整型（signed int）
%d 有符号整型（signed int）
%f 浮点型（float）
%lf 双精度浮点型（double）
%ld 有符号长整型（signed long）
%li 有符号长整型（signed long）

上述格式标识符使用大写字母也有效。
函数名命名为PutValue()，以下就是我这个函数的实现：

Code:

boolJPropertyScript::PutValue(constchar*fmt,...)
{
assert(fmt!=0);//实现断言，防止错误引起的崩溃
void*pBase=(char*)(&fmt)+sizeof(char*);
inti,j,k,varNum=0;
intlength=int(strlen(fmt));
//第一次遍历格式字符串，得到变量的数量
for(i=0;i<length;i++)if(fmt[i]=='%')varNum++;
char**ppVarName=newchar*[varNum];//开辟空间，用来存入文件
assert(ppVarName!=0);//实现断言，防止错误引起的崩溃
for(i=0;i<varNum;i++)
{
ppVarName[i]=newchar[64];
assert(ppVarName[i]!=0);//实现断言，防止错误引起的崩溃
memset(ppVarName[i],0,64);//清零
}
ofstreamwrite;
write.open(fileName,std::ios::out);
//第二次遍历格式字符串，存入文件
for(i=j=k=0;i<varNum;j++)
{
if(fmt[j]=='%')
{
write<<ppVarName[i];
switch(fmt[j+1])
{
case'c':case'C':
{
signedint*p=(signedint*)pBase;
write<<*p<<'/n';
j++,p++;
pBase=(void*)p;
break;
}
case's':case'S':
if(fmt[j+2]=='d')
{
signedint*p=(signedint*)pBase;
write<<*p<<'/n';
j+=2,p++;
pBase=(void*)p;
}
else/*Dosomethingaboutthestring*/;
break;
case'u':case'U':
switch(fmt[j+2])
{
case's':case'S':
{
unsignedint*p=(unsignedint*)pBase;
write<<*p<<'/n';
j+=2,p++;
pBase=(void*)p;
break;
}
case'i':case'I':
case'd':case'D':
{
unsignedint*p=(unsignedint*)pBase;
write<<*p<<'/n';
j+=2,p++;
pBase=(void*)p;
break;
}
case'l':case'L':
{
unsignedlong*p=(unsignedlong*)pBase;
write<<*p<<'/n';
j+=2,p++;
pBase=(void*)p;
break;
}
}
case'i':case'I':
case'd':case'D':
{
signedint*p=(signedint*)pBase;
write<<*p<<'/n';
j++,p++;
pBase=(void*)p;
break;
}
case'f':case'F':
{
double*p=(double*)pBase;
write<<*p<<'/n';
j++,p++;
pBase=(void*)p;
break;
}
case'l':case'L':
switch(fmt[j+2])
{
case'f':case'F':
{
double*p=(double*)pBase;
write<<*p<<'/n';
j+=2,p++;
pBase=(void*)p;
break;
}
case'd':case'D':
case'i':case'I':
signedlong*p=(signedlong*)pBase;
write<<*p<<'/n';
j+=2,p++;
pBase=(void*)p;
break;
}
}
i++,k=0;
}
elseppVarName[i][k]=fmt[j],k++;
}
write.close();
for(i=0;i<varNum;i++)
delete[]ppVarName[i];
delete[]ppVarName;
returntrue;
}
/*--------------------------------------------------------------------------*/

这里fileName涉及到一个类的私有成员，且与主题无关，因此略去。
主函数使用这条语句进行调用：
temp.PutValue( "好东西=%f这样的=%f", 12.1f, 12.4f )
其中temp是一个类的对象，与主题无关在此略去。
打开我们创建的fileName，结果我们可以看到如下文本：