ELF文件漫游?

#Linux下的可执行文件格式ELF
###前言

可执行文件的分类:
windows:PE(.exe .dll .lib)
linux:ELF(.out .so .a)

1 ELF文件结构(如图)
在这里插入图片描述
ELF head要在第一个存放,而Program Header table与Section Header则不一定要与上图一致。

Program header table标识了各种各样的段(segment)应该如何组织,拥有什么样的权限。给进程用的。
Section header table是用来组织ELF文件储存在磁盘上各个节(Section)的信息,是给ELF文件用的。

1.2 段和节
下面这张图生动的说明了段和节的关系
在这里插入图片描述
section在汇编中的作用是标识下面的一段内容是干嘛的。而segment则是在多个可重定向文件要整合成一个可执行文件时,连接器把目标文件中相同的section整合为一个segment,方便加载器的加载。

1.3 ELF的两个视图
在这里插入图片描述

其中的linking view便是在磁盘中的ELF(如上所说,磁盘中为section而不是segment,因为还没有经过链接),execution view便是内存中的ELF了。
下面的图形象的体现了两个视图的关系。
在这里插入图片描述

当我们在shell中执行$ ./elf时候,各种节便会经过连接器整合为段。

1.4 虚拟内存
虚拟内存是计算机系统内存管理的一种技术。它使得应用程序认为它拥有连续可用的内存(一个连续完整的地址空间),而实际上物理内存通常被分隔成多个内存碎片,还有部分暂时存储在外部磁盘存储器上,在需要时进行数据交换。与没有使用虚拟内存技术的系统相比,使用这种技术使得大型程序的编写变得更容易,对真正的物理内存(例如RAM)的使用也更有效率。此外,虚拟内存技术可以使多个进程共享同一个运行库,并通过分割不同进程的内存空间来提高系统的安全性。

1.虚拟内存用户空间每个进程一份
2.虚拟内存内核空间所有进程共享一份
3.虚拟内存mmap段中动态链接库仅在物理内纯中装载一份

1.5 进程虚拟地址空间

地址以字节编码 1BYTE = 8 bits(经常用16进制表示)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SKQbGylK-1669515562441)(/pic/ELF/图片5.png “Magic Gardens”)]
其中又分为动态存储区和静态存储区。动态存储区如Stack和Heap。静态则是各种的segment。

1.6 段与节
一个包含多个。段视图用于进程的内存区域的rwx权限划分。节视图用于ELF文件编译链接时与在磁盘上存储时的文件结构的组织。

在这里插入图片描述

GOT, 即Global Offset Table, 全局偏移表. 是链接器在执行链接时实际上要填充的部分, 保存了所有外部符号的地址信息。每个函数占用一个GOT表项。每个被目标模块引用的全局符号(函数或者变量)都对应于GOT中一个8字节的条目
PLT全称Procedure Linkage Table,即过程链接表。它在可执行文件中也是一个单独的section,位于.text section的前面。每个被可执行程序调用的库函数都有它自己的PLT条目。每个条目实际上都是一小段可执行的代码。
.got.plt相当于.plt的GOT全局偏移表, 其内容有两种情况, 1)如果在之前查找过该符号,内容为外部函数的具体地址。2)如果没查找过, 则内容为跳转回.plt的代码, 并执行查找。(emmm,有点PE中的IET IAT那味了)

.got保存全局变量引用的地址,.got.plt保存函数引用地址。
贴个图,希望可以帮助大家理解
在这里插入图片描述

关于.got和.plt的话,可以参考这两篇文章。
https://blog.csdn.net/u011987514/article/details/67716639
https://linyt.blog.csdn.net/article/details/51635768

下面在介绍一些常见的段和结构:

bss段:

bss段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。

bss是英文Block Started by Symbol的简称。

bss段属于静态内存分配。

data段:

数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。

数据段属于静态内存分配。

text段:

代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。

这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读(某些架构也允许代码段为可写,即允许修改程序)。

在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

堆(heap):

堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。

当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);

当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)。

栈(stack):

栈又称堆栈,是用户存放程序临时创建的局部变量,

也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。

除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。

由于栈的先进先出(FIFO)特点,所以栈特别方便用来保存/恢复调用现场。

从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

1.7 大端序与小端序

小端序:低地址在数据低位,高地址在数据高位
大端序:低地址在数据高位,高地址在数据低位

如 0A0B0C0D在小端序的排列顺序:
a : 0D
a+1 : 0C
a+2 : 0B
a+3 : 0A

1.8 动态链接与静态链接

静态链接方式:在程序执行之前完成所有的组装工作,也就是说源代码中的函数已经包含进了可执行程序,生成一个可执行的目标文件(ELF文件)该文件包含了运行时所需的全部代码。(体积大)

动态链接方式:动态链接是相对于静态链接来说的。他并没有把函数拷贝到可执行文件中,而是在其中加入了所调用函数的描述信息(往往是一些重定位信息)。当程序装入内存开始运行时(不知道看到这里,大家是否会联想到上面的.plt与.got呢?),与.so建立链接关系

1.9 常用的汇编指令

  1. MOV dest, src ;把源操作数传送给目标
  2. LEA REG,SRC ; 把源操作数的地址传到保存的位置
  3. PUSH与POP ;压栈与入栈
  4. LEAVE ;函数返回时候,恢复栈帧
    传送给目标
  5. LEA REG,SRC ; 把源操作数的地址传到保存的位置
  6. PUSH与POP ;压栈与入栈
  7. LEAVE ;函数返回时候,恢复栈帧
  8. RET ;在函数返回时候,控制程序执行流返回父函数
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值