1、介绍
nm用来列出目标文件中的符号,用以定位和分析执行程序和目标文件中的符号信息和它的属性。它可以和readelf、objdump、addr2line工具配合使用。
1.1 参数总结
选项 | 描述 |
-A | 同选项 --print-file-name |
-a | 同选项 --debug-syms |
-B | 同选项 --format=bsd。这是默认设置 |
-C [type] | 同选项 --demangle |
-D | 同选项 –dynamic |
--debug-syms | 显示调试器使用的符号。通常不会显示这些符号 |
--demangle[=type] | demangles 符号,使它变回源代码中找到的用户级的名字。如果指定类型,会为如下类型之一:auto、gnu、lucid、arm、hp、edg、gnu-v3、java、gnat 或 compaq |
--dynamic | 对于动态目标,例如共享库,该选项可以显示动态符号而不是普通符号 |
--extern-only | 显示定义为外部的符号 |
-f fmt | 同选项 --format |
--format=fmt | 使用指定的输出格式显示符号。可选的格式包括 bsd、sysv 和 posix,其中 bsd 为默认格式 |
-g | 同选项 --extern-only |
-h | 显示选项列表,然后退出 |
--help | 显示选项列表,然后退出 |
-l | 同选项 --line-numbers |
--line-numbers | 使用文件中保存的调试信息来确定文件名和每个符号的行号 |
-n | 同选项 --numeric-sort |
--no-sort | 指出不要将符号排序 |
--numeric-sort | 按照符号地址的数值排序 |
-o | 同选项 --print-file-name |
-p | 同选项 --no-sort |
-P | 同选项 --format=posix |
--portability | 同选项 --format=posix |
--print-armap | 在列举静态库成员符号时,该选项包含了模块的索引信息及其他信息,正是该模块含有所列符号 |
--print-file-name | 用源文件的名字标记每个符号,而不是只在文件头命名源文件 |
-r | 同选项 --reverse-sort |
--radix=base | 指出打印符号值的数字的进制。可选的为 d 的十进制、o 的八进制、或 x 的十六进制 |
--reverse-sort | 反序排列,不论字母还是数字均可 |
-s | 同选项 --print-armap |
--size-sort | 按照尺寸进行符号排序。计算尺寸取的是下一个符号的最高地址和本符号的地址的差。输出列出的是尺寸而不是通常的地址 |
-t base | 同选项 --radix |
--target=bfdname | bfdname 是目标文件格式的名字,它不是当前机器的名字。为得到已知格式名字列表,键入命令 objdump –i |
-u | 同选项--undefined-only |
--undefined-only | 只显示文件引用但未定义的符号 |
-V | 同选项 --version |
--version | 显示版本信息,然后退出 |
1.2 类型总结
用nm可以得到类似如下的结果:
$ nm main.o
0000000000000004 C bbb
0000000000000000 D ccc
0000000000000008 D ddd
0000000000000000 T main
U printf
对于每一个符号,提供了其地址、类型、符号名。那么这些类型代表什么含义呢?我们总结到如下表格里:
符号类型 | 说明 |
A | 该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。 |
B | 该符号的值出现在非初始化数据段(bss)中。例如,在一个文件中定义全局static int test。则该符号test的类型为b,位于bss section中。其值表示该符号在bss段中的偏移。一般而言,bss段分配于RAM中 |
C | 该符号为common。common symbol是未初始话数据段。该符号没有包含于一个普通section中。只有在链接过程中才进行分配。符号的值表示该符号需要的字节数。例如在一个c文件中,定义int test,并且该符号在别的地方会被引用,则该符号类型即为C。否则其类型为B。 |
D | 该符号位于初始话数据段中。一般来说,分配到data section中。例如定义全局int baud_table[5] = {9600, 19200, 38400, 57600, 115200},则会分配于初始化数据段中。 |
G | 该符号也位于初始化数据段中。主要用于small object提高访问small data object的一种方式。 |
I | 该符号是对另一个符号的间接引用。 |
N | 该符号是一个debugging符号。 |
R | 该符号位于只读数据区。例如定义全局const int test[] = {123, 123};则test就是一个只读数据区的符号。注意在cygwin下如果使用gcc直接编译成MZ格式时,源文件中的test对应_test,并且其符号类型为D,即初始化数据段中。但是如果使用m6812-elf-gcc这样的交叉编译工具,源文件中的test对应目标文件的test,即没有添加下划线,并且其符号类型为R。一般而言,位于rodata section。值得注意的是,如果在一个函数中定义const char *test = “abc”, const char test_int = 3。使用nm都不会得到符号信息,但是字符串“abc”分配于只读存储器中,test在rodata section中,大小为4。 |
S | 符号位于非初始化数据区,用于small object。 |
T | 该符号位于代码区text section。 |
U | 该符号在当前文件中是未定义的,即该符号的定义在别的文件中。例如,当前文件调用另一个文件中定义的函数,在这个被调用的函数在当前就是未定义的;但是在定义它的文件中类型是T。但是对于全局变量来说,在定义它的文件中,其符号类型为C,在使用它的文件中,其类型为U。 |
V | 该符号是一个weak object。 |
W | The symbol is a weak symbol that has not been specifically tagged as a weak object symbol. |
- | 该符号是a.out格式文件中的stabs symbol。 |
? | 该符号类型没有定义 |
2、例子
我们创建一个文件main.c:
#include <stdio.h>
int bbb;
int ccc = 20;
char *ddd = "abcdefg";
int main()
{
int aaa = 10;
printf("tttttt : %d\n", aaa);
return 0;
}
然后编译其生成.o文件:
$ gcc -c main.c
$ ls
main.c main.o
这时我们通过nm命令查看:
$ nm main.o
0000000000000004 C bbb
0000000000000000 D ccc
0000000000000008 D ddd
0000000000000000 T main
U printf
可见:
1)aaa不在里面,因为它是局部变量
2)bbb类型为C,因为它是未初始化的全局变量
3)ccc和ddd类型为D,因为它是初始化的全局变量,所以在初始化数据段
4)main位于代码区
5)printf当前未定义
如果我们把main.o链接成可执行文件后,可见其符号就会多很多:
$ gcc main.o -o main
$ nm main
000000000060104c B bbb
0000000000601048 B __bss_start
0000000000601038 D ccc
0000000000601048 b completed.7594
0000000000601028 D __data_start
0000000000601028 W data_start
0000000000601040 D ddd
0000000000400460 t deregister_tm_clones
00000000004004e0 t __do_global_dtors_aux
0000000000600e18 t __do_global_dtors_aux_fini_array_entry
0000000000601030 D __dso_handle
0000000000600e28 d _DYNAMIC
0000000000601048 D _edata
0000000000601050 B _end
00000000004005c4 T _fini
0000000000400500 t frame_dummy
0000000000600e10 t __frame_dummy_init_array_entry
0000000000400710 r __FRAME_END__
0000000000601000 d _GLOBAL_OFFSET_TABLE_
w __gmon_start__
00000000004005ec r __GNU_EH_FRAME_HDR
00000000004003c8 T _init
0000000000600e18 t __init_array_end
0000000000600e10 t __init_array_start
00000000004005d0 R _IO_stdin_used
w _ITM_deregisterTMCloneTable
w _ITM_registerTMCloneTable
0000000000600e20 d __JCR_END__
0000000000600e20 d __JCR_LIST__
w _Jv_RegisterClasses
00000000004005c0 T __libc_csu_fini
0000000000400550 T __libc_csu_init
U __libc_start_main@@GLIBC_2.2.5
0000000000400526 T main
U printf@@GLIBC_2.2.5
00000000004004a0 t register_tm_clones
0000000000400430 T _start
0000000000601048 D __TMC_END__
也可以看到printf虽然还是标记为U,但是明确指出来它在哪里:U printf@@GLIBC_2.2.5。