AT&T汇编语言(第六章 MANIPLUTING THE STRING AND DATA BLOCKS)

本文详细介绍了汇编语言中关于字符串和数据块的处理,包括内存拷贝(MOVS、REP、LODS、STOS)、内存比较(CMPS、REPCMPS、SCAS)等操作,以及在实际应用中的注意事项和常见问题。通过实例展示了如何进行字符串拷贝、比较以及查找操作,强调了循环计数器的选择和边界条件的设定对程序正确性的影响。
摘要由CSDN通过智能技术生成

系列文章目录

第六章 MANIPLUTING THE STRING AND DATA BLOCKS


提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

字符串处理和数据块处理

提示:以下是本篇文章正文内容,下面案例可供参考

一、内存块拷贝

1.1 MOVS


movb 从%esi指向的内存取一个字节,赋值给%edi指向的内存。
在这里插入图片描述
leal value1+22, %esi # 把value1+22地址赋值给%esi,等价于
movl $22(value1), %esi
DF只决定%esi,%edi在赋值后的移动方向,但是movs?命令读取的方向是不变的。

在这里插入图片描述

1.2 REP

本节所有例子里都有一个问题,就是没有为目标字符串保留一个保存'\0'的位置。如果要保存一个23个字符的字符串,则需要申请24字节。后面的例子就不一一说明了。

在这里插入图片描述
rep只能执行一个命令循环。movsb通过重复单字节拷贝实现字符串拷贝。功能够可以实现,但是效率比较低。cld是清除DF标志位,即设置DF=0(increase)
在这里插入图片描述
movsl一次拷贝4字节,但是字符个数不能刚好被4整除,循环次数设置不当会导致内存写溢出。注意ecx循环次数的设置,不能超过申请的内存长度。output只有23字节,%ecx等于6,则output拷贝了24字节。往output后面多写了一个字节。可能会导致严重错误。“This is a test string \nO”,‘O’就是多写的内容。
在这里插入图片描述
老师说可以通过length = . - string1来计算字符串的长度。但是我试过在.data段定义,编译器不认识’.’,在.text段可以用’.’,但是此时当前指令已经不是字符串后面一个指令了。
shrl,算术右移
shrl $2, %ecx # 算术右移2位,即除以4

andl $3, %ecx # 按位与,取后两位,除以4后的余数

在这里插入图片描述
std,DF = 0,从后往前拷贝

1.3 LODS

在这里插入图片描述
多次写的时候,rep lodsl,实际上后面的写覆盖了前面的结果。
用处不大。

1.4 STOS

在这里插入图片描述
可以通过rep stosl重复将AL/AX/EAX/RAX写入%edi/%rdi指向的内存。
可以用来初始化内存。

在这里插入图片描述
lodsb,将%esi中内容取出一个字节写入%AL,即空格
rep stosb,用%AL中的内容重复写256次到%edi,即buffer中。
其实对%AL赋值可以直接用movb space, %AL。这个例子只是为了体现lodsb和stosb的用法。

在这里插入图片描述
将小写字母转换为大写字符。

main:
    leal string1, %esi  # 将string1首地址赋值给%esi
    movl %esi, %edi     # 将%esi的值赋值给%edi,即%edi页保存了string1的首地址
    movl length, %ecx   # 将length赋值给%ecx,循环计数器为43
    cld                 # 清除Direction Flag,即DF = 0
loop1:
    lodsb               # 将%esi的低8位取出赋值给%al,指令完成后移动%esi指向下一个字符'h'
    cmpb $'a', %al      # 比较%al字符与'a'的大小,结果不写入%al,但是会设置状态标志位
    jl skip             # 如果%al中的字符小于‘a’则跳到skip。大写字符ascii小于‘a’
    cmpb $'z', %al      # 比较%al字符与'z'的大小
    jg skip             # 如果大于'z'则跳到skip。不处理大于'z'的字符
    subb $0x20, %al     # %al = %al - 0x20; 如果字符是在'a'~'z'之间则做减操作
skip:
    stosb               # 将%al中的字符写入,%edi,注意%edi和%esi指向同一段内存
    loop loop1          # 回到循环开始
    

二、内存比较

2.1 CMPS

在这里插入图片描述
movl $1, %eax # 系统调用 exit,程序写得不好,应该在使用的时候赋值。否则中间被覆盖了就有问题了。
整体就是value1等于value2就返回0:exit(0),不等于返回1, exit(1)
可以弄一个循环,就可以不只比较4个字节了。

2.2 REP CMPS

在这里插入图片描述
check if ZF == 0
ZF = 0,则result不等0,即两个数不相等。
这里这个条件写得不好,有误导的嫌疑。
检查是否相等,应该是
Check if ZF == 1

指令含义跳出循环检查
REPELoop if equalCheck if ZF == 0
REPNELoop if not equalcheck if ZF != 0
REPZLoop if zeroSame as REPE
REPNZLoop if not zeroSame as REPNE

在这里插入图片描述

PPT中的例子感觉不太对,主要是循环计数器应该是用长度比较小的数字,而不是比较长的。用两个字符串较长的作为循环计数,会导致越界读。——老师后面在讲6c的时候,讲了这部分内容。确认了确实有问题。

.section .data
string1:
    .ascii "test"
length1:
    .int 4
string2:
    .ascii "test1"
length2:
    .int 5
.section .text
.globl main

main:
    lea string1, %esi  # string1的地址赋值给%esi
    lea string2, %edi  # string2的地址赋值给%edi
    movl length1, %ecx # string1的长度赋值给%ecx
    movl length2, %eax # string2的长度赋值给%eax
    cmpl %eax, %ecx
    ja longer          # 如果%ecx > %eax,即length1 > length2,则跳转到longer标签
    xchg %ecx, %eax    # 如果%ecx <= %eax,则交换,即%ecx保存长度长的那个数字
longer:
    cld                # DF = 0
    repe cmpsb         # 如果%esi与%edi中的字符相等则一直比,直到不相等,或者%ecx等于0
    je equal           # 如果最后一个字符相等,即跳出循环是因为%ecx等于0,因为%ecx是长的,所以实际上此时两个字符串一定是相同的。但是程序中还进行了长度的判断。另外循环中因为%ecx是长的,所以短的那个可能会越界读。这个是有问题的,应该是用短的长度循环更符合逻辑。
    jg greater
less:
    movl $1, %eax
    movl $255, %ebx
    int $0x80
greater:
    movl $1, %eax
    movl $1, %ebx
    int $0x80
equal:
    movl length1, %ecx
    movl length2, %eax
    cmpl %ecx, %eax
    jg greater              # 这个地方为什么用jg而不是ja?
    jl less
    movl $1, %eax
    movl $0, %ebx
    int $0x80

最后返回结果是255
在这里插入图片描述
这个结果是错的,就是因为计数器选择了长的。代码改为:

......
cmpl %eax, %ecx
    jl shorter          # 如果%ecx < %eax,则跳转到shorter,因length1 < length2,则跳转到shorter标签
    xchg %ecx, %eax    # 如果%ecx <= %eax,则交换,即%ecx保存长度长的那个数字
shorter:
    cld                # DF = 0
......
# 或者
cmpl %ecx, %eax        # 但是这样不直接,不能一眼看出来其实是想找较短的长度

修改后执行,返回结果是1
在这里插入图片描述

2.3 SCAS

在这里插入图片描述

.section .data
string1:
    .ascii "This is a test - a long text string to scan."
length:
    .int 44
string2:
    .ascii "-"
.section .text
.globl main

main:
    leal string1, %edi
    leal string2, %esi
    movl length, %ecx
    lodsb                # 从%esi指向的内存取出一个字节放入%al
    cld                  # clear DF
    repne scasb          # 如果%al中的字符,在%edi指向的内存没找到,则继续找。找到了或者%ecx等于0停止循环查找
    jne notfound         # 跳出循环结果是没找到,则跳到notfound标签
    subw length, %cx     # 找到了,则用%cx循环后剩下的长度-总长度,等于-已经查找过的长度。
    neg %cx              # 对%cx取反,则%cx等于找到字符到开始长度
    movl $1, %eax
    movl %ecx, %ebx      # 返回长度
    int $0x80            # exit(%ecx)
notfound:
    movl $1, %eax
    movl $0, %ebx
    int $0x80            # 没找到返回exit(0)

执行结果为16:
在这里插入图片描述
这里echo $0命令用来查询之前执行程序的返回值。即:./scaschar的返回值

在这里插入图片描述
查找多个字节,存在对齐问题。对于目标字符串与要找的字符串不对齐,则找不到。
但是找数字是非常好用的。

在这里插入图片描述
求字符串的长度。
通过定义字符串带’\0’结尾,计算字符串长度。

三、总结

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值