解析VC++ Name Mangling 机制

解析VC++ Name Mangling 机制

 

摘要

C++中,Name Mangling 是为了支持重载而加入的一项技术,目前C++ Name Mangling 并没有统一的标准,也没有较完整的中文文档化资料,所以本篇文章在VS2005环境中,解析C++ Name Mangling 的技术细节,以及怎样将VC Name Mangling后的名称还原为可读的形式。

 

目录

l        Name Mangling 简介

 

l        VC环境中Name Mangling

 

n         VC环境中C 语言的 Name Mangling

n         VC环境中C++ 语言中的 Name Mangling

l        Name Mangling 后的名称还原为可读的形式

 

 

Name Mangling 简介

Name Mangling 是一种在编译过程中,将函数、变量的名称重新改编的机制。在 C++重载、namespace等操作符下,函数可以有同样的名字,编译器为了区分各个不同地方的函数,将各个函数通过编译器内定的算法,将函数改成唯一的名称。

Name Mangling翻译成中文意思为:名字修饰、名字改编等,由于对这个翻译没有统一的约定,所以本文中采用英文表示。

在写VC++程序时,我们有时会遇到类似于error LNK2019: unresolved external symbol "void __cdecl MyFun (void)" (?MyFun@@YAXXZ) referenced in function _wmain”的连接错误,此语句中“?MyFun@@YAXXZ”是VC Name Mangling后的结果。本文主要讨论Name Mangling 后名称还原为可读的方式。

本文首先讨论 VC 环境中,C/C++ 语言的 Name Mangling 算法机制。然后讨论手动将 C++ 语言 Name Mangling 后的字符串转换为函数的定义式,最后编码实现还原。

 

VC环境中Name Mangling

VC中,微软采用了自己独特的Name Mangling技术,当然微软也为此Name Mangling技术申请了专利。

想要查看 VC 将函数名称 Name Mangling 的结果,只需将函数声明,不实现,然后调用之即可。

下面先讨论VC环境中C语言的Name Mangling技术,然后再讨论C++

 

VC环境中C 语言的 Name Mangling

    VC中,也可以采用C语言编译器,只需要如下设置:Project à Property…à Configuration Properties à C/C++ à Advanced à Compile As,将其设为“(/TC)”即可。至于文件后缀是否为cppVC并不关心。

C 语言中,函数可以有如下声明方式(其中 __CALLTYPE 可以为 __cdecl__stdcall__fastcall等)[1]

1void __CALLTYPE fun();

2int __CALLTYPE fun();

3int __CALLTYPE fun(int);

4double __CALLTYPE fun(int, double);

5int* __CALLTYPE fun(int*, char*);

我们先假设此处 CALLTYPE __cdecl(即:#define __CALLTYPE __cdecl),在 VC 中,Name Mangling 结果如下:

1_fun

2_fun

3_fun

4_fun

5_fun

       由此可见,在 VC 编译 C 语言时(__cdecl),仅仅在函数名前加“_”。

我们再看看其他调用方式,如:__stdcall#define __CALLTYPE __stdcall),结果如下:

       1_fun@0

    2_fun@0

       3_fun@4

       4_fun@12

    5_fun@8

    最后,我们看看 __fastcall 的结果(#define __CALLTYPE __ fastcall):

1@fun@0

2@fun@0

3@fun@4

4@fun@12

5@fun@8

由此,我们可以得出结论,从被 Name Mangling 后的字符串推断出原来的函数名。

1__cdecl

在此声明方式下,仅仅在函数名前加一个下划线,至于函数返回值、参数,完全没有处理。

2__stdcall

在此声明方式下,在函数名前加一个下划线,然后紧跟“@”符号,最后是函数参数大小总和(注意:此总和包含了字节填充)。

3__fastcall

在此声明方式下,跟 __stdcall 唯一不同的是,函数前面的下划线变为了“@”符号。

 

由上面 5 个实例函数,我们大概可以看到 VC 环境中,C 语言 Name Mangling 技术了,但也可以发现,从 Name Mangling 后的字符串,并不能得出函数原来的定义式。不同的定义式,Name Mangling 后的名称可以相同,由此也可以知道,C 语言不支持函数重载。

号线stdcall

函数名:cl----------------------------------------

 

VC环境中C++ 语言中的 Name Mangling

C++ 语言中,函数需要支持重载,新增命名空间函数调用、类函数调用、运算符重载、模板函数等等,所以情况也比 C 语言复杂很多。

下面我们列举一些函数例子进行分析,函数可以有如下声明方式(其中 __CALLTYPE 可以为 __cdecl__stdcall__fastcall等)[1]

1void __CALLTYPE fun();

2int __CALLTYPE fun();

3int __CALLTYPE fun(int);

4double __CALLTYPE fun(int, double);

5int* __CALLTYPE fun(int*, char*);

6class ABCD

{

public:

        int __CALLTYPE fun();

};

7template<typename T>

int fun(typename T);

我们仍先假设此处 CALLTYPE __cdecl(即:#define __CALLTYPE __cdecl),在 VC 中,Name Mangling 结果如下:

       1?fun@@YAXXZ

2?fun@@YAHXZ

3?fun@@YAHH@Z

    4?fun@@YANHN@Z

    5?fun@@YAPAHPAHPAD@Z

    6?fun@ABCD@@QAAHXZ

    7??$fun@H@@YAHH@Z

由此可见,C++ Name Mangling 技术比 C 语言的复杂很多。

我们挑选第一条分析一下,“?”表示一个函数的开始,用以区别于 C 语言的“_”,fun 为函数名称,“@@YA”表示函数调用约定为 __cdecl,“X”表示函数的参数为空,“XZ”为结束标识。

将上述名称还原为可读方式并不复杂,但要记住这些规则,考虑到所有组合方式却是一件比较复杂的事情,下面我们来看看一个比较复杂的函数调用,声明函数如下:

int funconst CString&, const std::vector&;

Name Mangling 后的结果为:

?fun@@YAHABV?$CStringT@_WV?$StrTraitATL@_WV?$ChTraitsCRT@_W@ATL@@@ATL@@@ATL@@ABV?$vector@NV?$allocator@N@std@@@std@@@Z

如此长的一串,用人脑来直接分析显然不符合实际,好在 Windows 提供了 API 函数用于解析字符串,具体解析办法,下面一节将详细解释。

 

Name Mangling 后的名称还原为可读的形式

Windows DbgHelp.dll 导出函数中,UnDecorateSymbolName 是用于解析 Name Mangling 字符串的,具体函数的细节可以查看 MSDN。如下为实例代码:

void UnDecorateName()

{

    char szDecorateName[1024] = {0};

    char szUnDecorateName[2048] = {0};

    printf("Please Input Decorated Name: ");

    scanf("%s", szDecorateName);

 

   if (UnDecorateSymbolName(szDecorateName, szUnDecorateName, sizeof(szUnDecorateName), UNDNAME_COMPLETE) == 0)

    {

        printf("UnDecorateSymbolName Failed. GetLastError() = %d", GetLastError());

        getchar();

        return;

    }

 

    printf("The UnDecorated Name Is: %s/r/n", szUnDecorateName);

    getchar();

    return;

}

 

Xp 中当我们输入如上的:?fun@@YAPAHPAHPAD@Z

程序得出的结果为:int * __cdecl fun(int *,char *)

注意:在 Xp 中,带有模板的 Name Mangling 字符串无法直接还原,如需还原,可以在 VistaWin7 中运行此程序。

 

 

---------------------------------------------------------

[1]:关于函数调用约定的细节,可以查看我写的另一篇文章:“C/C++函数调用约定”。地址:http://blog.csdn.net/xt_xiaotian/archive/2010/03/10/5363633.aspx

  • 2
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
文中是linux下 C++动态库 实现接口提供类导出的一个例子 注意其中使用函数返回基类指针的用法,因为Linux的动态链接库不能像MFC中那样直接导出类 一、介绍 如何使用dlopen API动态地加载C++函数和类,是Unix C++程序员经常碰到的问题。 事实上,情况偶尔有些复杂,需要一些解释。这正是写这篇mini HOWTO的缘由。 理解这篇文档的前提是对C/C++语言中dlopen API有基本的了解。 这篇HOWTO的维护链接是: http://www.isotton.com/howtos/C++-dlopen-mini-HOWTO/ 二、问题所在 有时你想在运行时加载一个库(并使用其中的函数),这在你为你的程序写一些插件或模块架构的时候经常发生。 在C语言中,加载一个库轻而易举(调用dlopen、dlsym和dlclose就够了),但对C++来说,情况稍微复杂。 动态加载一个C++库的困难一部分是因为C++的name mangling (译者注:也有人把它翻译为“名字毁坏”,我觉得还是不翻译好), 另一部分是因为dlopen API是用C语言实现的,因而没有提供一个合适的方式来装载类。 在解释如何装载C++库之前,最好再详细了解一下name mangling。 我推荐您了解一下它,即使您对它不感兴趣。因为这有助于您理解问题是如何产生的,如何才能解决它们。 1. Name Mangling 在每个C++程序(或库、目标文件)中, 所有非静态(non-static)函数在二进制文件中都是以“符号(symbol)”形式出现的。 这些符号都是唯一的字符串,从而把各个函数在程序、库、目标文件中区分开来。 在C中,符号名正是函数名:strcpy函数的符号名就是“strcpy”,等等。 这可能是因为两个非静态函数的名字一定各不相同的缘故。 而C++允许重载(不同的函数有相同的名字但不同的参数), 并且有很多C所没有的特性──比如类、成员函数、异常说明──几乎不可能直接用函数名作符号名。 为了解决这个问题,C++采用了所谓的name mangling。它把函数名和一些信息(如参数数量和大小)杂糅在一起, 改造成奇形怪状,只有编译器才懂的符号名。 例如,被mangle后的foo可能看起来像foo@4%6^,或者,符号名里头甚至不包括“foo”。 其中一个问题是,C++标准(目前是[ISO14882])并没有定义名字必须如何被mangle, 所以每个编译器都按自己的方式来进行name mangling。 有些编译器甚至在不同版本间更换mangling算法(尤其是g++ 2.x和3.x)。 即使您搞清楚了您的编译器到底怎么进行mangling的,从而可以用dlsym调用函数了, 但可能仅仅限于您手头的这个编译器而已,而无法在下一版编译器下工作。 三、类 使用dlopen API的另一个问题是,它只支持加载函数。 但在C++中,您可能要用到库中的一个类,而这需要创建该类的一个实例,这不容易做到。 四、解决方案 1. extern "C" C++有个特定的关键字用来声明采用C binding的函数: extern "C" 。 用 extern "C"声明的函数将使用函数名作符号名,就像C函数一样。 因此,只有非成员函数才能被声明为extern "C",并且不能被重载。 尽管限制多多,extern "C"函数还是非常有用,因为它们可以象C函数一样被dlopen动态加载。 冠以extern "C"限定符后,并不意味着函数中无法使用C++代码了, 相反,它仍然是一个完全的C++函数,可以使用任何C++特性和各种类型的参数。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值