浅析Swift中的Copy-on-Write

什么是Copy-on-Write

写入时复制(英语:Copy-on-write,简称COW)是一种计算机程序设计领域的优化策略。其核心思想是,如果有多个调用者(callers)同时请求相同资源(如内存或磁盘上的数据存储),他们会共同获取相同的指针指向相同的资源,直到某个调用者试图修改资源的内容时,系统才会真正复制一份专用副本(private copy)给该调用者,而其他调用者所见到的最初的资源仍然保持不变。这过程对其他的调用者都是透明的。此作法主要的优点是如果调用者没有修改该资源,就不会有副本(private copy)被建立,因此多个调用者只是读取操作时可以共享同一份资源。

在 Swift 中,Copy-on-Write(写时复制)是一种优化技术,用于在需要进行修改时避免不必要的数据复制。它主要用于值类型(value types),如结构体(struct)和枚举(enum)。

在 Swift 中,当将一个值类型赋值给另一个变量或常量时,通常会发生值的复制。这意味着原始值的一个副本会被创建,并分配给新的变量或常量。这样,原始值和副本是完全独立的,对其中一个进行修改不会影响另一个。

然而,有时候进行这种复制操作是不必要的,特别是当值类型的实例是不可变的(immutable)或者只有一个引用时。为了避免不必要的复制开销,Swift 使用了 Copy-on-Write 机制。

Copy-on-Write 的基本思想是,当一个不可变的值类型实例被复制时,实际上只会增加一个指向原始数据的引用计数。只有在进行修改操作时,才会对值进行复制,以确保修改操作不会影响到其他引用。

具体来说,当一个不可变的值类型实例被赋值给一个新的变量或常量时,原始值的引用计数会增加。这样,原始值和新的变量或常量共享同一个内存。当进行第一次修改操作时,Copy-on-Write 机制会检查原始值的引用计数。如果引用计数为 1,表示该值没有被共享,可以直接进行修改。但如果引用计数大于 1,表示该值被多个引用共享,此时会进行复制操作,创建一个新的副本,并将修改操作应用在副本上,而不是原始值上。

通过使用 Copy-on-Write 机制,Swift 可以避免不必要的复制开销,提高性能和内存效率。这种优化技术在 Swift 的标准库中被广泛应用,特别是在ArrayDictionarySet这样的集合类型中。

需要注意的是,Copy-on-Write 仅适用于值类型(value types),对于引用类型(reference types)如类(class),它不会自动应用。对于引用类型,需要手动实现类似的行为,例如使用复制构造函数(copy constructor)或提供自定义的复制方法。

下面,看看 Swift 中 COW 的具体体现。

基本数据类型

从下面的打印信息中我们可以看到,对于StringInt等基本类型的数据进行赋值时就发生了拷贝操作。

/// 打印地址
func address(of object: UnsafeRawPointer) {
    let addr = Int(bitPattern: object)
    print(String(format: "%p", addr))
}

var str1 = "1234"
var str2 = str1
address(of: &str1)  //0x100008108
address(of: &str2)  //0x100008118

var num1 = 5
var num2 = num1
address(of: &num1)  //0x100008128
address(of: &num2)  //0x100008130

集合类型

对于集合类型,如下面的arr1和arr2,我们可以看到在对写入操作前,赋值操作并未发生拷贝操作;在对arr2进行修改(即写入)后,arr2的地址发生变化,也就是说此时发生了拷贝操作。

var arr1 = [1,2,3,4]
var arr2 = arr1

//修改前,arr1和arr2地址一样
address(of: &arr1)   //0x600001708420
address(of: &arr2)   //0x600001708420

//对arr2进行修改
arr2[2] = 0

//修改arr2后,arr2地址变了
address(of: &arr1)   //0x600001708420
address(of: &arr2)   //0x600001708460

自定义的结构体

我们知道 Swift 中的 COW 适用于值类型数据,而且通常是集合类型的。那么对于自定义的结构体是否默认也存在这种机制呢?

struct MyStruct {
    var data: [Int]
}

var obj1 = MyStruct(data: [1, 2, 3])
var obj2 = obj1

address(of: &obj1)  //0x100008148
address(of: &obj2)  //0x100008150

obj2.data[0] = 100

address(of: &obj1)  //0x100008148
address(of: &obj2)  //0x100008150

从上面的打印可以看出,对于自定义的结构体,并不支持COW。

COW的实现

在 Swift 的GitHub官方文档OptimizationTips.rst中有这样一段代码:

/// 将实际值存于class Ref中,以便实现`reference type`
final class Ref<T> { //必须使用final修饰
    var val: T
    init(_ v: T) { val = v }
}

/// Box包装`reference type`
struct Box<T> {
    var ref: Ref<T>
    init(_ x: T) { ref = Ref(x) }

    var value: T {
        get { return ref.val }
        set {
            //在进行写操作前,检查是否有其他引用,如果有,进行复制
            if !isKnownUniquelyReferenced(&ref) {
                ref = Ref(newValue)
                return
            }
            ref.val = newValue
        }
    }
}

struct TestCOW {
    var id: Int = 0
}

let test = TestCOW()

var box1 = Box(test)
var box2 = box1

address(of: &box1.ref.val)  //0x600000201570
address(of: &box2.ref.val)  //0x600000201570

box2.value.id = 1

address(of: &box1.ref.val)  //0x600000201570
address(of: &box2.ref.val)  //0x600000201d90

需要注意的是class Ref<T>必须使用final修饰,有以下几个原因:

  • 避免类的继承:将 Ref<T> 类定义为 final 可以防止其他类继承它。由于 Ref<T> 类是用于支持 Box 结构体的内部实现,而不是作为可继承的基类,因此将其定义为 final 可以确保它不会被错误地继承和扩展。
  • 保持引用计数的一致性:Ref<T> 类使用 isKnownUniquelyReferenced(_😃 函数来检查引用计数,以确定是否需要进行复制。如果 Ref<T> 类是可继承的,其他子类可能会引入对引用计数的修改,导致 isKnownUniquelyReferenced(_😃 函数的结果不准确。通过将 Ref<T> 类定义为 final,可以确保引用计数的一致性,从而正确地实现 Copy-on-Write 的逻辑。

参考

维基百科中的写入时复制

Use copy-on-write semantics for large values

Understanding Swift Copy-on-Write mechanisms

  • 29
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值