linux内核编程memcpy,memcpy Linux内核实现引发的思考:为什么嵌入式汇编中不用指定段寄存器...

memcpy Linux内核实现引发的思考:为什么嵌入式汇编中不用指定段寄存器

(2013-05-18 18:42:25)

标签:

内核

汇编

指定

杂谈

memcpy

Linux内核实现引发的思考:为什么嵌入式汇编中不用指定段寄存器最近买了王爽的汇编语言和Linux内核完全注释,准备开始好好学习一下汇编语言,并看看早期的Linux(0.11版本)源代码实现。

之前舍友面试TX是被问过memcpy什么时候不能用,这种问题如何解决?

答:当dest,src都指向同一个数组且dest>src,那么当n大于abs(dest >

src),则这个时候最后m=(n - abs(dest >

src))个字节会被覆盖。可以用memmove来规避这种问题,因为memmove有对dest和src大小进行判断,根据不同的结果进行升序拷贝(dest

< src)和逆序拷贝(dest >= src)。

memcpy Linux(0.11版本)源代码实现如下:

extern inline void * memcpy(void * dest, const void * src, int

n)

{

__asm__ ("cld\n\t"

"rep\n\t"

"movsb"

::"c"(n),"S"(src),"D"(dest)

:"cx","si","di");

return dest;

}

我们可以发现memcpy是从源地址直接到目的地址的逐字节的升序拷贝。因为是逐字节的升序拷贝,所以但拷贝的指针是指向同一个数#20540;时可能会出现问题。

让我们再来看一下memmove的Linux(0.11版本)源代码实现如下:

extern inline void * memmove(void * dest, const void * src, int

n)

{

if (dest < src)

{

__asm__ ("cld\n\t"

"rep\n\t"

"movsb"

::"c"(n),"S"(src),"D"(dest)

:"cx","si","di");

}

else

{

__asm__ ("std\n\t"

"rep\n\t"

"movsb"

::"c"(n),"S"(src #43; n - 1),"D"(dest #43; n - 1)

:"cx","si","di");

}

return dest;

}

我们发现memmove并没有判断dest和src是否指向同一数组(实际上也无法判断),而是判断dest和src之间的大小关系,并根据大小比较结果采取不同的拷贝策略,当dest小于src采用升序拷贝,否则采用逆序拷贝。

到这里思考就结束了?其实并没有,我们可以看看一下这两个实现对应的汇编代码。这里我只看了memcpy的汇编代码,下面我截取了memcpy

对应的汇编代码的实现(gcc -S test.c来获取test.c对应的汇编代码):

5 memcpy:

6 pushl �p

7 movl %esp, �p

8 pushl �i

9 pushl %esi

10 pushl �x

11 movl 16(�p), �x

12 movl 12(�p), �x

13 movl 8(�p), �x

14 movl �x, �x

15 movl �x, %esi

16 movl �x, �i

17 #APP

18 # 5 "t.c" 1

19 cld

20 rep movsb

21 # 0 "" 2

22 #NO_APP

23 movl 8(�p), �x

24 popl �x

25 popl %esi

26 popl �i

27 popl �p

28 ret

最为关键的几行汇编代码如下:

14 movl �x, �x

15 movl �x, %esi

16 movl �x, �i

17 #APP

18 # 5 "t.c" 1

19 cld

20 rep movsb

17,18行为gcc嵌入的注释,可以无视,学过8086汇编的人都知道对内存地址的访问需要知道段地址和偏移地址,可是对应memcpy的汇编代码并没有显示地对es和ds这连个寄存器进行赋#20540;,刚开始以为段地址是在调用memcpy前调用,为了证实这个猜想写了个demo程序,在main函数中调用memcpy函数,并用gcc把源代码转换成汇编代码,查看了源代码发现,在调用memcpy前并没有设置es和ds这两个段寄存器。后面我陷入了困惑,问题一直没有解开。

后面在看《深入理解计算机系统书》的第三章时,发现了这样的描述“最初的8086的存储器模型和它在80286中的扩展都已经过时了,作为替代按摩椅导购网,Linux使用了平面寻址方式(flat

addressing),在这种寻址方式中,程序员将整个存储空间看做一个大的字节数组”,心想难道段寄存器不用设置了,也不用段寄存器了?

在好奇心的驱动下搜索了“平面寻址

不需要段地址?”看了第一篇文章(),最后的几行描述是“Windows操作系统为用户程序“安排好了一切”。具体表现在为用户程序的代码段、数据段和堆栈段全部预定义好了段描述符。这些段的起始地址为0,限长为ffffffff,所以用它们可以直接寻址全部的4

GB地址空间。程序开始执行的时候,CS,DS,ES和SS都已经指向了正确的描述符,在整个程序的生命周期内,程序员不必改动这些段寄存器,也不必关心它们的#20540;究竟是多少(实际上,想改也改不了)。

答案终于揭晓:“程序开始执行的时候,CS,DS,ES和SS都已经指向了正确的描述符,在整个程序的生命周期内,程序员不必改动这些段寄存器,也不必关心它们的#20540;究竟是多少(实际上,想改也改不了)。”

总结:我学的8086是早期的汇编,gcc 转换而成的汇编是基于IA32(Intel Architecture

32-bit)的汇编,寻址方式已经发生了改变。要猜想,并去验证。

分享:

a4c26d1e5885305701be709a3d33442f.png喜欢

0

a4c26d1e5885305701be709a3d33442f.png赠金笔

加载中,请稍候......

评论加载中,请稍候...

发评论

登录名: 密码: 找回密码 注册记住登录状态

昵   称:

评论并转载此博文

a4c26d1e5885305701be709a3d33442f.png

发评论

以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值