汇编窥探string底层

String(字符串),是所有编程语言中非常重要的成员,因此非常值得去深入研究。众所周知,字符串的本质是字符序列,由若干个字符组成。比如字符串 "iOS" 由 'i'、'O'、'S' 三个字符组成。(这里不考虑有些编程语言中提及的尾部的 '\0')

01

思考

在 Swift 开发使用字符串的过程中,你是否有思考过以下问题?

1 个字符串变量占用多少内存?

 字符串 str1、str2 的底层存储有什么不同?

如果对 str1、str2 进行拼接操作,str1、str2 的底层存储又会发生什么变化?

如果你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制还是比较了解的。

02

1 个字符串变量占用多少内存?

方法 1:MemoryLayout

首先,可以借助 Swift 自带的 MemoryLayout 来测试一下

 

方法 2:汇编

另外,我们也可以借助一个强有力的底层分析助手—汇编语言,来窥探一下 String 的底层存储

实际上分析其他语法、系统库的底层,都可以借助汇编语言

 比如多态的原理、泛型的原理、Array 的底层、枚举的底层等等

另外,不仅仅是 Swift,C、C++、OC等语言 的底层分析,依然可以借助汇编语言

毕竟你写的每一行有效代码,最终都是要转成机器指令(0 和 1)

而机器指令是跟汇编指令一一对应的,每一条机器指令都能翻译成与之对应的汇编指令

能读懂汇编指令,就相当于能读懂机器指令,知道 CPU 具体在干嘛(操作了什么寄存器,操作了哪块内存)

本教程的代码是直接跑在Mac的命令行(CommandLineTools)项目上

因此展示的汇编代码是基于 x64 的 AT&T 格式汇编,并非 iOS 真机设备的 ARM 汇编,其实不同种类的汇编之间有极大的相似性,只是有些指令、寄存器的叫法不一样

跟微软的 Visual Studio 一样,Xcode 也内置了非常方便的反汇编功能,可以轻松查看每一句代码对应的汇编指令,打开反汇编界面的步骤如下

在某一行需要调试的代码打上断点(反汇编界面会在断点调试状态下显示出来)

菜单:Debug > Debug Workflow > Always Show Disassembly

Assembly 译为汇编, Disassembly 译为反汇编。

 运行程序,看到反汇编界面

如果你的反汇编经验十足,根据第13~17行的汇编代码就可以推敲出来,String 是占用16个字节

13行调用init 函数初始化 String,然后使用 rax、rdx 寄存器存放返回值

 16、17 行是将 rax、rdx 的内存赋值给 str 变量

由于 rax、rdx 都是8个字节的,所以 str 占用16个字节

汇编的内容比较多,因为时间和篇幅关系,文章里并不会对每一句汇编指令进行详细地讲解,更多的是想说明汇编的重要性。

03

字符串的底层存储

窥探内存

此前我写了个可以窥探Swift变量内存的小工具:https://github.com/CoderMJLee/Mems

现在用它来窥探下字符串的16字节里面,究竟存储着什么数据。

Mems.memStr(ofVal:) 默认情况下按照8个字节一组来显示内存数据

 传递参数alignment: one 是按照1个字节一组来显示内存数据。

字符'0'~'9'的ASCII值是0x30~0x39,认真观察str1的16个字节数据,你发现了什么?

它直接将所有字符的ASCII值存储在str1的16字节中

最后1个字节0xea中的0xa就是字符的数量,也是共10个字符

拼接

可以发现,当对 str1 进行拼接 "ABCDE" 的时候

它最终是将"0123456789ABCDE"十五个字符的 ASCII 值都存储在了 str1 的 16 字节中

最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符

可以看得出来,目前16个字节已经存满了,那如果再拼接1个字符呢?

可以看到,str1 里面存储的数据发生了非常大的变化,每一个字符的 ASCII 值不见了。

那里面的 16 字节具体是什么含义呢?

所有字符('0'~'9'、'A' ~ 'F')的 ASCII 值又存到哪去了呢?

其他情况

如果一开始初始化的时候(未拼接之前),字符串的内容就是超过 15 个字符呢?

相信你能猜到是这个结果

这16个字节里面并没有出现任何一个字符的ASCII 值,但这16个字节跟第27行的str1 还是有所区别。

虽然它们的字符串内容都是"0123456789ABCDEF"

如果对 str2 进行拼接操作:

不难发现:这时 str2 的 16 字节又发生了变化,跟 第27行的str1 是有点相似的

如何解决上述疑问?

上述的种种疑问,光看打印出来的内存数据是无法解决的,但是都可以利用【!!!汇编!!!】来解决,分析汇编指令,立马就得出结论,因为文章的篇幅有限,平时工作也比较忙,我把上述问题的详细剖析过程录制成了长达2个多小时的视频,有兴趣的朋友可以用 1.5~2 倍速度观看

链接:

https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA

提取码:kzrk

视频对于没有汇编基础的朋友来说,可能会有点难度,最好挑一个头脑清醒的时间去观看

看完视频后,希望大家能够确切地感受到汇编语言的重要性,不要永远只停留在编写高级语言代码、沉迷于语法糖的层面

04

汇编的价值

最后想多说一句:汇编能给你带来的价值远远不止这篇文章所说的窥探字符串的底层,对你的程序生涯影响绝对是终生受益的(数据结构与算法功底也是如此)。

比如你还能玩转软件破解、游戏外挂等,这是我此前用【汇编\C++】编写的一个游戏外挂:

https://github.com/CoderMJLee/SeemygoPVZCheater

05

 更多Swift相关的话题

在今年6月份,我推了一套针对有经验iOS开发者的Swift课程,全程利用汇编来讲解Swift语法,涵盖了全部常用语法、汇编、OC混编、函数式编程、响应式编程、面向协议编程、源码分析等,下面是课程大纲:

部分章节如下所示:

闭包

面向对象

 属性

如果你仅仅是想学点Swift的皮毛、入个门,建议不要学习此课程,因为有童鞋觉得我的Swift课程太难了,全是汇编、本质、原理。

但要成为“大神”就要狠下功夫,因为Swift很容易区分程序员的水平,两个程度不同的程序员写出的Swift代码,从美观性、性能上面很容易就能看出差距。

前文提到针对有经验iOS开发者的《从入门到精通Swift编程》全新课程,目前本篇文章的读者,可以享受7.5折的专属优惠。

机会不是天天有,该出手时就出手!
先到就是赚到!比你的竞争对手更快一步!


扫描二维码进群,

获取课程优惠券,和编程大牛学习交流! 

扫描下方二维码就可以加入我们一起学习!


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值