[翻译]Go 数据结构

[翻译]Go 数据结构

http://mikespook.com/2013/12/%e7%bf%bb%e8%af%91go-%e6%95%b0%e6%8d%ae%e7%bb%93%e6%9e%84/#more-1775

关于 Go 的内存结构在 Go 内存模型 中已经有介绍,但是内容相对简单,许多细节也一带而过。Ross Cox 的这篇文章 Go Data Structure 讲解得比较系统也很全面的一篇。翻译至此,希望能对大家有帮助。

2009 年的旧文,发现自己当时没有翻译完。所以再次做了增补和修改。如果我没记错,应该已经有人在 OSC 上发表过同一篇文章的翻译了。大家对照参考阅读吧。

————翻译分隔线————

Go 数据结构

每当给新手介绍 Go 的时候,我发现为了建立起关于哪个操作成本更加高昂的正确观念,将 Go 如何为其值分配内存说明清楚会很有帮助。本文介绍了基础类型、结构体、数组和切片(slice)。

基本类型

先来看看几个简单的例子:

godata1

变量 i 的类型是 int,在内存中表现为一个 32 位的字。(所有图展示的都为 32 位内存结构;在当前的实现里,在 64 位的架构中只有指针会变大,int 仍然还是 32 位,不过也可能选择 64 位来作为替代实现。)

由于显式的转换,变量 j 的类型是 int32。虽然 ij 有相同的内存布局,但是它们是不同的类型:赋值i = j 会产生一个类型错误,因此必须显式的进行转换:i = int(j)

变量 f 的类型是 float,当前的实现是 32 位的浮点类型。它的内存占用与 int32 一样,但内部布局不同。

结构体与指针

接下来,变量 bytes 的类型是 [5]byte,一个有 5 字节的数组。它的内存表现就是这 5 个字节,跟 C 的数组一样一个个挨着。类似的primes 是一个有 4 个 int 的数组。

Go,更接近 C 而不是 Java,它为程序员提供了是不是指针的权力。例如,这个类型定义:

type Point struct{ X, Y int }

定义了一个叫做 Point 的简单的结构类型,在内存中表现为两个相邻的 int

godata1a

复合文法语句Point{10, 20}Point 进行了初始化。对一个复合文法进行取地址表示了一个指向刚刚分配并初始化的Point 的指针。前者在内存中是两个字;后者是一个指向两个字的内存的指针。

结构体中的字段在内存中是一个挨一个的排布的。

type Rect1 struct{ Min, Max Point }
type Rect2 struct{ Min, Max *Point }

godata1b

Rect1,一个有两个 Point 字段的结构体,表达成一行有两个 Point,或者说四个intRect2,一个有两个 *Point 字段的结构体,表达成两个 *Point。

那些使用过 C 的程序员可能不会对 Point 字段和 *Point 字段之间的区别感到惊讶,而哪些仅仅使用过 Java 或 Python(以及其他……)可能对决定使用哪种而感到诧异。通过为程序员提供了基本的内存布局控制能力,Go 提供了对一组数据结构的整体大小、分配数量和内存访问模式进行控制的能力。所有都是构建能够良好运行的系统的关键。

字符串

有了前面这些铺垫,我们可以继续了解那些更加有趣的数据类型了。

godata2

(灰色箭头表示存在于实现中,但是无法在程序中直接看到的指针。)

一个 string 在内存中表现为双字结构体,包含指向字符串数据的指针和其长度。由于 string 是不可变的,因此多个字符串共享同一存储空间是安全的。那么如果对s行切,片使其成为一个新的双字结构体,会在内部生成另一个指针和长度,但仍然指向相同的字节序列。这意味着切片可以在不进行任何分配和复制的情况下完成,因此切片同指定序号轮寻字符串同样有效率。

(从另一方面来说,在 Java 和其他语言中将字符串切片到更小的片段时,有一个众所周知的问题,即便是只有一个小片段被使用的情况下,原始的引用都将在内存中保留整个原始字符串。Go 也有同样的问题。我们已经尝试但拒绝了一个使用分配和复制的替代方案,这个方案会让字符串切片的成本更加高昂,大多数程序都希望避免这一情况。)

slice

godata3

一个 slice 是指向一个数组的某个片段的引用。在内存中,它是一个三字结构体,包含了指向首元素的指针、slice 的长度和容量。长度是类似 x[i] 这样的索引操作的上限,而容量是x[i:j] 这样的切片操作的上限。

与对字符串切片一样,对数组切片也不会产生复制:它仅仅创建一个新的用于保存不同的指针、长度和容量的结构体。在这个例子中,复合文法 []int{2, 3, 5, 7, 11} 创建了一个包含有五个值的新数组,然后设置了 slicex 的字段来描述这个数组。slice 表达式 x[1:3] 没有分配任何数据:它只是填充了一个指向相同底层存储的新的 slice 结构体。在例子中,长度为 2,y[0]y[1] 是唯一合法的序号;而容量是 4,y[0:4] 是一个合法的 slice 表达式。(参阅 Effective Go 了解更多关于 slice 长度和容量,以及如何使用的内容。)

由于 slice 是一个多字结构体,在没有指针的情况下,切片操作不需要分配内存,甚至是 slice 头也不需要,它通常保存在栈上。这使得 slice 的使用与在 C 中传递指定的指针和长度的成本一样低廉。Go 最初将 slice 作为一个指向上面展示的结构体的指针,但是这样的话意味着每一个切片操作都会分配新的内存对象。即便使用快速分配也为垃圾回收器产生了许多额外的工作。我们发现了这一情况,就像前面在字符串部分已经提及的,这种情况下程序可能会避免切片操作而使用轮寻。移除了这些间接量与内存分配,使得 slice 的成本已经足够低廉,在大多数情况下都不需要轮寻了。

new 和 make

Go 有两个数据结构创建函数:newmake。它们的区别最初可能引起混淆,不过很快就会感到正常。最基本的区别是new(T) 返回一个 *T,一个 Go 程序可以隐式抛弃的指针(图中黑色箭头),但 make(T, args) 返回一个原始的T 而不是指针。通常 T 有其内部隐式实现的指针(图中灰色的箭头)。new 返回一个指向空值填充的内存,而make 返回一个复杂的结构体。

godata4

有一种办法可以将这两种情况统一起来,不过可能会颠覆从 C 和 C++ 而来的传统:定义 make(*T) 来返回一个指向新分配的 T 的内存,那么当前 new(Point) 可以写为 make(*Point)。我们对此尝试了几天,但是觉得这与人们通常希望的内存分配函数实在大相径庭。

即将来临

这已经够长了。接口值、map 和 channel 将只能等待以后的文章了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 适合毕业设计、课程设计作业。这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。 所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一时间进行解答!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值