linux内核编程memcpy,memcpy Linux内核实现引发的思考：为什么嵌入式汇编中不用指定段寄存器...

最新推荐文章于 2023-10-26 14:24:58 发布

mlopscommunity

最新推荐文章于 2023-10-26 14:24:58 发布

阅读量374

点赞数

文章标签： linux内核编程memcpy

memcpy Linux内核实现引发的思考：为什么嵌入式汇编中不用指定段寄存器

(2013-05-18 18:42:25)

标签：

内核

汇编

指定

杂谈

memcpy

Linux内核实现引发的思考：为什么嵌入式汇编中不用指定段寄存器最近买了王爽的汇编语言和Linux内核完全注释，准备开始好好学习一下汇编语言，并看看早期的Linux(0.11版本)源代码实现。

之前舍友面试TX是被问过memcpy什么时候不能用，这种问题如何解决？

答：当dest，src都指向同一个数组且dest>src，那么当n大于abs(dest >

src),则这个时候最后m=(n - abs(dest >

src))个字节会被覆盖。可以用memmove来规避这种问题，因为memmove有对dest和src大小进行判断，根据不同的结果进行升序拷贝(dest

< src)和逆序拷贝(dest >= src)。

memcpy Linux(0.11版本)源代码实现如下：

extern inline void * memcpy(void * dest, const void * src, int

{

__asm__ ("cld\n\t"

"rep\n\t"

"movsb"

::"c"(n),"S"(src),"D"(dest)

:"cx","si","di");

return dest;

}

我们可以发现memcpy是从源地址直接到目的地址的逐字节的升序拷贝。因为是逐字节的升序拷贝，所以但拷贝的指针是指向同一个数#20540;时可能会出现问题。

让我们再来看一下memmove的Linux(0.11版本)源代码实现如下：

extern inline void * memmove(void * dest, const void * src, int

{

if (dest < src)

{

__asm__ ("cld\n\t"

"rep\n\t"

"movsb"

::"c"(n),"S"(src),"D"(dest)

:"cx","si","di");

}

else

{

__asm__ ("std\n\t"

"rep\n\t"

"movsb"

::"c"(n),"S"(src #43; n - 1),"D"(dest #43; n - 1)

:"cx","si","di");

}

return dest;

}

我们发现memmove并没有判断dest和src是否指向同一数组(实际上也无法判断)，而是判断dest和src之间的大小关系，并根据大小比较结果采取不同的拷贝策略，当dest小于src采用升序拷贝，否则采用逆序拷贝。

到这里思考就结束了？其实并没有，我们可以看看一下这两个实现对应的汇编代码。这里我只看了memcpy的汇编代码，下面我截取了memcpy

对应的汇编代码的实现(gcc -S test.c来获取test.c对应的汇编代码)：

5 memcpy:

6 pushl �p

7 movl %esp, �p

8 pushl �i

9 pushl %esi

10 pushl �x

11 movl 16(�p), �x

12 movl 12(�p), �x

13 movl 8(�p), �x

14 movl �x, �x

15 movl �x, %esi

16 movl �x, �i

17 #APP

18 # 5 "t.c" 1

19 cld

20 rep movsb

21 # 0 "" 2

22 #NO_APP

23 movl 8(�p), �x

24 popl �x

25 popl %esi

26 popl �i

27 popl �p

28 ret

最为关键的几行汇编代码如下：

14 movl �x, �x

15 movl �x, %esi

16 movl �x, �i

17 #APP

18 # 5 "t.c" 1

19 cld

20 rep movsb

17,18行为gcc嵌入的注释，可以无视，学过8086汇编的人都知道对内存地址的访问需要知道段地址和偏移地址，可是对应memcpy的汇编代码并没有显示地对es和ds这连个寄存器进行赋#20540;，刚开始以为段地址是在调用memcpy前调用，为了证实这个猜想写了个demo程序，在main函数中调用memcpy函数，并用gcc把源代码转换成汇编代码，查看了源代码发现，在调用memcpy前并没有设置es和ds这两个段寄存器。后面我陷入了困惑，问题一直没有解开。

后面在看《深入理解计算机系统书》的第三章时，发现了这样的描述“最初的8086的存储器模型和它在80286中的扩展都已经过时了，作为替代按摩椅导购网，Linux使用了平面寻址方式(flat

addressing)，在这种寻址方式中，程序员将整个存储空间看做一个大的字节数组”，心想难道段寄存器不用设置了，也不用段寄存器了？

在好奇心的驱动下搜索了“平面寻址

不需要段地址?”看了第一篇文章()，最后的几行描述是“Windows操作系统为用户程序“安排好了一切”。具体表现在为用户程序的代码段、数据段和堆栈段全部预定义好了段描述符。这些段的起始地址为0，限长为ffffffff，所以用它们可以直接寻址全部的4

GB地址空间。程序开始执行的时候，CS，DS，ES和SS都已经指向了正确的描述符，在整个程序的生命周期内，程序员不必改动这些段寄存器，也不必关心它们的#20540;究竟是多少(实际上，想改也改不了)。

”

答案终于揭晓：“程序开始执行的时候，CS，DS，ES和SS都已经指向了正确的描述符，在整个程序的生命周期内，程序员不必改动这些段寄存器，也不必关心它们的#20540;究竟是多少(实际上，想改也改不了)。”

总结：我学的8086是早期的汇编，gcc 转换而成的汇编是基于IA32(Intel Architecture

32-bit)的汇编，寻址方式已经发生了改变。要猜想，并去验证。

喜欢

赠金笔

加载中，请稍候......

评论加载中，请稍候...

发评论

登录名：密码：找回密码注册记住登录状态

昵称：

评论并转载此博文

发评论

以上网友发言只代表其个人观点，不代表新浪网的观点或立场。

mlopscommunity

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
linux内核编程memcpy,memcpy Linux内核实现引发的思考：为什么嵌入式汇编中不用指定段寄存器...

memcpyLinux内核实现引发的思考：为什么嵌入式汇编中不用指定段寄存器(2013-05-18 18:42:25)标签：内核汇编指定杂谈memcpyLinux内核实现引发的思考：为什么嵌入式汇编中不用指定段寄存器最近买了王爽的汇编语言和Linux内核完全注释，准备开始好好学习一下汇编语言，并看看早期的Linux(0.11版本)源代码实现。之前舍友面试TX是被问过memcpy什么时候不能用，这...
复制链接

扫一扫