如何减少Ruby中的内存使用

翻译 2018年02月09日 21:08:47

原文:Reducing Memory Usage in Ruby

作者:tenderlove

翻译:无阻我飞扬

摘要:Ruby的GC用于垃圾回收,释放内存给回系统。本文作者以代码示例介绍了Ruby中的指令序列、指令序列格式以及指令序列的引用和压缩,重点引出了如何在Ruby中节省内存。以下是译文。

本人一直在努力用Ruby构建一个压缩垃圾收集器,而实现压缩GC(垃圾收集器)的最大障碍之一就是更新引用。例如,如果对象A指向对象B,但是压缩GC移动对象B,那么如何确保对象A指向对象B的新位置呢?

对大多数对象来说,解决这个问题是相当直接的。Ruby的垃圾收集器熟知大多数Ruby对象的内部结构,所以在压缩器运行以后,它会遍历所有的对象,并更新其内部指向任何移动对象的新位置。如果GC不知道某个对象的内部结构(例如在C扩展中实现的对象),则不允许该对象引用的内容移动。例如,对象A指向对象B。如果GC不知道如何更新对象A的内部结构,它将不允许对象B移动(称之为“钉住”一个对象)。

当然,允许移动的对象越多越好。

前面提到过,更新大多数对象的引用是相当直接的。不幸的是,有一根刺在我身边有一段时间了,那就是指令序列。

指令序列

当Ruby代码被编译的时候,它被转换为指令序列对象,而这些对象是Ruby对象。通常不会与这些Ruby对象交互,但它们就在那里。这些对象为Ruby应用程序存储字节码,代码中的任何文字,以及关于被编译的代码(源位置,覆盖信息等等)的一些其它杂项信息。

这些指令序列对象在内部被称为“IMEMO”对象。IMEMO对象有多个子类型,指令序列子类型为“iseq”。如果使用的是Ruby2.5,并且使用ObjectSpace堆转储,则会看到转储现在包含这些IMEMO子类型。接下来看一个例子。

在Rails应用程序中,我一直在使用下面的代码来堆转储:

require 'objspace'
require 'config/environment'

File.open('output.txt', 'w') do |f|
  ObjectSpace.dump_all(output: f)
end

上面的代码将内存中的所有对象以JSON行格式输出到名为“output.txt”的文件中。下面是来自Rails堆转储的两个IMEMO记录:

{
  "address": "0x7fc89d00c400",
  "type": "IMEMO",
  "class": "0x7fc89e95c130",
  "imemo_type": "ment",
  "memsize": 40,
  "flags": {
    "wb_protected": true,
    "old": true,
    "uncollectible": true,
    "marked": true
  }
}
{
  "address": "0x7fc89d00c2e8",
  "type": "IMEMO",
  "imemo_type": "iseq",
  "references": [
    "0x7fc89d00c270",
    "0x7fc89e989a68",
    "0x7fc89e989a68",
    "0x7fc89d00ef48"
  ],
  "memsize": 40,
  "flags": {
    "wb_protected": true,
    "old": true,
    "uncollectible": true,
    "marked": true
  }
}

这个例子来自Ruby2.5,所以两个记录都包含一个imemo_type字段。第一个例子是“ment”或“method entry”,第二个例子是“iseq”或“指令序列”。接下来看看指令序列。

指令序列的格式

指令序列是编译Ruby代码的结果。指令序列是Ruby代码的二进制表示形式。这些指令存储在指令序列对象中,具体是这个iseq_encoded字段iseq_sizeiseq_encoded字段的长度)。

如果检查iseq_encoded,会发现这只是一个数字列表。数字列表是虚拟机指令以及指令的参数(操作数)。

如果检查这个iseq_encoded列表,它可能看起来像这样:

地址 描 述
0 0x00000001001cddad 指令(0个操作数)
1 0x00000001001cdeee 指令(2个操作数)
2 0x00000001001cdf1e 操作数
3 0x000000010184c400 操作数
4 0x00000001001cdeee 指令(2个操作数)
5 0x00000001001c8040 操作数
6 0x0000000100609e40 操作数
7 0x0000000100743d10 指令(1个操作数)
8 0x00000001001c8040 操作数
9 0x0000000100609e50 指令(1个操作数)
10 0x0000000100743d38 操作数

列表中的每个元素对应于指令或指令的操作数。指令的所有操作数都遵循列表中的指令。操作数是执行相应指令所需的一切,包括Ruby对象。换句话说,其中一些地址可能是Ruby对象的地址。

由于其中一些地址可能是Ruby对象的地址,这意味着指令序列引用了Ruby对象。但是,如果指令序列引用Ruby对象,那么指令序列如何防止这些Ruby对象被垃圾收集呢?

活跃度和代码编译

正如之前所说,指令序列是编译Ruby代码的结果。在编译过程中,代码的某些部分被转换为Ruby对象,然后这些对象的地址被嵌入到字节代码中。来看一个Ruby对象何时嵌入到指令序列中的例子,然后看看这些对象是如何保持活力的。

示例代码就是puts "hello world"。可以使用RubyVM::InstructionSequence编译代码,然后反汇编它。反汇编解码iseq_encoded并打印出更可读的东西。

>> insns = RubyVM::InstructionSequence.compile 'puts "hello world"'
=> <RubyVM::InstructionSequence:<compiled>@<compiled>>
>> puts insns.disasm
== disasm: #<ISeq:<compiled>@<compiled>>================================
0000 trace            1                                               (   1)
0002 putself          
0003 putstring        "hello world"
0005 opt_send_without_block <callinfo!mid:puts, argc:1, FCALL|ARGS_SIMPLE>, <callcache>
0008 leave            
=> nil
>>

指令003putstring指令。看看可以在insns.def找到putstring指令的定义:

/* put string val. string will be copied. */
DEFINE_INSN
putstring
(VALUE str)
()
(VALUE val)
{
    val = rb_str_resurrect(str);
}

当虚拟机执行时,它将跳转到putstring指令的位置 ,解码操作数,并将这些操作数提供给指令。在这种情况下,putstring指令有一个所谓的操作数str,它是VALUE类型,和一个称为val的返回值,它也是VALUE类型。指令体本身只是调用rb_str_resurrect,传递str和分配返回值给valrb_str_resurrect只是复制一个Ruby字符串。所以这个指令需要一个Ruby对象(一个已经存储在指令序列中的字符串),复制该字符串,然后虚拟机将该复制的字符串推入堆栈。为了一个有趣的练习,试着用puts "hello world".freeze来完成这个过程,并看看差异。

现在,字符串“hello world”如何在这条指令执行之前保持活跃?一些东西必须标记字符串对象,以便垃圾收集器知道引用正在被持有。

指令序列保持这些对象活跃的方式是通过使用它所谓的“标记数组”来实现的。当编译器将代码转换为指令序列时,它将为“hello world”分配一个字符串,然后将该字符串推送到一个数组上。下面是compile.c的摘录,它是这样做的:

case TS_VALUE:    /* VALUE */
{
    VALUE v = operands[j];
    generated_iseq[code_index + 1 + j] = v;
    /* to mark ruby object */
    iseq_add_mark_object(iseq, v);
    break;
}

所有的iseq_add_mark_object操作都是将VALUE推入到数组,这些数组存储着指令序列对象。 iseq是指令序列对象,并且v是想要保持活跃的VALUE(在这个案例中就是字符串“hello world”)。如果查看vm_core.h文件,可以找到该标记数组的位置以及注释:

VALUE mark_ary;     / *数组:包含应该用GC标记的操作数* /

指令序列引用和压缩

所以,指令序列包含两个字符串文字的引用:一个在iseq_encoded指令中,一个凭借标记数组。如果字符串文字移动,那么这两个位置都需要更新。更新数组内部结构是相当简单的:它只是一个列表,然而更新指令序列并不容易。

要在指令序列中更新引用,必须反汇编指令,定位每一个VALUE操作数,并更新这些位置。没有任何代码来执行这些指令,所以在这里介绍一个函数,它可以反汇编指令并调用这些对象的函数指针。这样就能够找到Ruby对象的新位置并更新指令。但是是不是可以用这个函数来做更多的事情呢?下面重点来了。

减少内存

现在终于到了关于节省内存的部分了。存储在指令序列对象中的标记数组的要点是保持指令序列引用的任何对象都是活跃的:

这里写图片描述

可以重新使用“update reference”函数来标记直接包含在指令序列中的引用。这意味着可以减少标记数组的大小:

这里写图片描述

完全消除标记数组是另外一码事,因为存储在标记数组中的东西不仅仅是文字。然而,如果直接从指令序列中标记对象,那么很少需要增加数组。节省的内存总量是数组的大小加上数组中所有未使用的额外容量

做了一个补丁来实现这个策略,可以在Ruby的GitHub fork上找到它 。

发现在基本Rails应用程序设置为生产模式时,可以节省大约3%的内存。当然,加载的代码越多,节省的内存就越多。预期这个补丁会影响GC的性能,因为反汇编指令并迭代它们应该比迭代一个数组更困难。然而,由于指令序列已成熟,并且有一代又一代的垃圾收集器,因此对真实应用程序的性能影响非常小。

我正致力于将这个补丁上传到Ruby官网,大家可以在这里关注并阅读更多有关于此的信息。

如何降低Windows程序的内存占用量

*前记:这几天在优化系统的过程中,发现整个软件刚一开机就占了快200M的物理内存,在hp的工作站上面感觉都有点吃力,更别说在普通的PC上了。但是我发现软件再最小化之后物理内存的占用量只有10M左右,于...
  • pinghegood
  • pinghegood
  • 2012年12月08日 16:18
  • 4397

怎么减少Redis内存占用

原文地址:http://redis.io/topics/faq Is there something I can do to lower the Redis memory usage? ...
  • tanga842428
  • tanga842428
  • 2016年09月24日 11:34
  • 608

JAVA减少内存使用的10个简单方法

1.尽量使用直接量 2.使用StringBuilder和StringBuffer进行字符串连接 3.尽早释放无用对象的引用 4.尽量少用静态变量 5.避免在经常调用的方法、循环中创建Java对...
  • lanmenghcc
  • lanmenghcc
  • 2013年01月16日 16:01
  • 1715

获取wince系统内存使用状态

GlobalMemoryStatus,Win32 API函数。此函数用来获得当前可用的物理和虚拟内存信息,函数定义为:VOID GlobalMemoryStatus(  LPMEMORYSTATUS ...
  • wen_hua
  • wen_hua
  • 2010年01月19日 15:28
  • 4080

如何降低App的待机内存

越用越卡为哪般——如何降低App的待机内存(一) 在智能手机兴起的这几年中,我们体验到了手机内存从256M到4G的巨大变化,进程可用的内存也从仅有16/32M到现在可以使用2G以上的内存。与此...
  • luyaran
  • luyaran
  • 2017年01月04日 08:26
  • 490

Ruby的内存管理机制。

原文在此 http://www.theirishpenguin.com/2009/10/29/understanding-how-ruby-stores-objects-in-memory-the-r...
  • ChenShaoXunHuan
  • ChenShaoXunHuan
  • 2015年03月03日 11:20
  • 1342

linux的highmem高端内存是如何被使用的

0-3G为用户地址空间 3G-4G为内核逻辑地址空间 其中3G-3G+896M为内核空间的低端地址空间,超过896M的内存归属为高端地址空间, 而高端内存有两种使用方式,一种是给内核使用 的,...
  • lcw_202
  • lcw_202
  • 2010年11月07日 21:22
  • 893

python使用yield来减少内存开销

本文参考自:http://www.ibm.com/developerworks/cn/opensource/os-cn-python-yield/ 以斐波那契数列的实现来说明这个问题: demo1...
  • zjm750617105
  • zjm750617105
  • 2016年01月17日 15:58
  • 1816

内存优化autoreleasepool的使用

在ARC内存管理模式下,使用 autoreleasepool 主要来避免频繁申请/释放内存,从页达到优化内存的效果。 根据 Apple的文档(https://developer.appl...
  • potato512
  • potato512
  • 2017年02月13日 14:56
  • 165

[Android 性能优化系列]内存之终极篇--降低你的内存消耗

[Android 性能优化系列]内存之终极篇--降低你的内存消耗
  • kifile
  • kifile
  • 2014年11月04日 07:51
  • 5344
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:如何减少Ruby中的内存使用
举报原因:
原因补充:

(最多只允许输入30个字)