C/C++杂谈-printf的可变参数机制

C/C++杂谈-printf的可变参数机制


C++11引入了可变参数模板机制,对模板参数进行了高度泛化,但是对于可变参数其实C语言学习中早已遇到过,那就是printf可以进行多参数的输出,这是怎么实现的呢?

printf的使用

我们对于printf的用法无非两种

    const char *str = "hello , world\n";
    printf(str);//直接传入字符串地址
    int year = 2023;
    printf("%d%s", year, "原神启动");//传入格式控制字符串地址和参数

我们printf的参数是先是一个字符串,后面才是我们的输出变量,可以嗅出printf对于多参数的控制应该和传入的第一个字符串有关,那么究竟是如何实现的呢?

printf的源码

//acenv.h
typedef char *va_list;
#define  _AUPBND        (sizeof (acpi_native_int) - 1)
#define  _ADNBND        (sizeof (acpi_native_int) - 1)
                        
#define _bnd(X, bnd)    (((sizeof (X)) + (bnd)) & (~(bnd)))
#define va_arg(ap, T)   (*(T *)(((ap) += (_bnd (T, _AUPBND))) - (_bnd (T,_ADNBND))))
#define va_end(ap)      (void) 0
#define va_start(ap, A) (void) ((ap) = (((char *) &(A)) + (_bnd (A,_AUPBND))))
//start.c
static char sprint_buf[1024];
int printf(char *fmt, ...)//格式控制字符串和C的函数多参数
{
        va_list args;//va_list就是char * 的typedef
        int n;
        va_start(args, fmt);
        n = vsprintf(sprint_buf, fmt, args);
        va_end(args);
        write(stdout, sprint_buf, n);
        return n;
}
//unistd.h
static inline long write(int fd, const char *buf, off_t count)
{
        return sys_write(fd, buf, count);
}

源码剖析

映入眼帘的就是一串宏定义

看我们printf的函数参数部分,char *fmt就是我们的格式控制字符串,后面的…是C的函数多参数,即后面的参数数目不定

va_list就是char * 的typedef,也就是定义了名为args的char指针

va_start(args, fmt);就是把args指向fmt后面的第一个参数的地址

这里对va_start进行解释

#define va_start(ap, A) (void) ((ap) = (((char *) &(A)) + (_bnd (A,_AUPBND))))
va_start(ap, A) 
    (void) ((ap) = (((char *) &(A)) + (_bnd (A,_AUPBND))))

可见ap指向的是A地址往后偏移_bnd字节,而 _bnd 传参了 _ADNBND,_ADNBND = (sizeof (acpi_native_int) - 1)

typedef s32 acpi_native_int 若采用这种宏定义,表明int 类型是用32位表示,也表示当前内存是4字节对齐

acpi_native_int这个参数是平台相关的

所以sizeof (acpi_native_int)是当前平台的int大小,我们假设是4字节,那么_ADNBND就是3

#define _bnd(char,3)    ==>  (1+3)&(~3)  ==> 4

#define _bnd(int,3)     ==>  (4+3)&(~3)  ==> 4

#define _bnd(double,3)  ==>  (4+3)&(~3)  ==> 8

我们通过上述样例可以明白**_bnd就是获取类型A的内存对齐大小**,假如32位平台那么就是4的倍数

所以va_start(args, fmt) 就是把fmt偏移char*内存对齐大小个字节然后赋值给args,这样args指向的就是格式字符串后面的参数

n = vsprintf(sprint_buf, fmt, args);这里的n则是我们实际控制输出的字符数,我们printf实际就是一个输出字符的函数,n也是我们的返回值

而后面的 write(stdout, sprint_buf, n);无非就是把缓冲区里的n个字符输出到stdout输出流,这就不是我们讨论的重点了

多参数实现机制原理

通过上面的剖析,我们发现printf由格式控制字符串得到下一个参数的起始地址,而下一个起始地址是fmt地址偏移内存对齐大小个字节

这是为什么呢?

这跟函数的压栈顺序有关。我们C/C++默认__cdel的从右至左将参数压栈,而我们栈是向下增长的,所以先入栈的地址高,后入栈的地址低,所以格式字符串的地址最低,往上偏移自然能得到其他参数的地址

void func(int a, int b, int c)
{
    printf("a = %d located [%x]\n", a, &a);
    printf("b = %d located [%x]\n", b, &b);
    printf("c = %d located [%x]\n", c, &c);
}
signed main()
{
    func(1, 2, 3);
    return 0;
}
//输出
a = 1 located [b3bff960]
b = 2 located [b3bff968]
c = 3 located [b3bff970]

得到地址后,由于我们规定格式控制字符串中%的数量即为输出参数数量,然后就能拿到所有参数放到缓冲区,再输出到标准输出流

如果我们想要实现多参数机制(需要了解<stdarg.h>),自然也要通过我们的参数设定模式,类似格式控制中百分号的数量来确定参数的数目,而名称出现的顺序对应参数的顺序。

可见C语言的多参数机制是很繁琐的,而我们C++11引入可变参数模板也正是为了追求更好的参数泛化。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

EQUINOX1

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值