Ruby之symbol研究

转载 2013年09月25日 17:16:54

1. 在一个名字或者字符串前面加上冒号,得到一个symbol对象。还可以通过String#to_sym、Fixnum#to_sym和String#intern得到。

2. 一般用symbol做hash的key,号称是为了节省内存,提高执行效率。

3. 为什么可以节省内存?Ruby中的String是可变对象,这一点跟Java、C#、Python都不一样。注意跟某些C++标准库中的COW的basic_string<T>也不一样。Ruby中每一个String都可以就地改变。可能是因为这个原因,Ruby中两个内容相同的字符串文本量实际上是两个不同的对象。

    a = "hello"
    b = "hello"

    虽然俩字符串内容都一样,但是你比一下a和b,就知道a.object_id != b.object_id,它们指向的不是同一个对象。结果反而很像未经string pooling优化的C语言的行为。到底immutable好还是mutable好,或者还是貌似聪明的COW好,见仁见智了。不过Ruby的设计在把字符串用作hash key的时候毛病就大了。比如你写:

    h["ruby"].name   = "Ruby"
    h["ruby"].author = "matz"
    h["ruby"].birth_year = 1995

的时候,"ruby"这个字符串动态生成了三次,占用三倍内存。这就严重地浪费了内存。而用:ruby做为key,因为在整个运行过程中,Ruby runtime保证名为:ruby的symbol对象只有一个,所以就不用生成三个,节省内存。

4. 为什么可以提高执行效率?显然的原因是免得多次动态生成'ruby'字符串了。还不单如此,Hash的key值应该是常量,所以Ruby的Hash对于作为key的String对象都要施加保护,所谓保护,也就是把String冻结了,免得你之后还改变其值。保护当然是有代价的,symbol无需保护,当然是能提高效率的。附带说明,其他mutable的对象也可以作为hash的key,这是Ruby设计得比较奇怪的地方。在irb里运行以下代码,你会发现Ruby的Hash丢值。

    h = Hash.new
    L = [1, 2]
    h[L] = "A big object!"
    L << 3 # 居然能改! 
    h[L]   # ==> nil,找不到了,似乎正常
    # 可是
    h[[1, 2]]  # ==> nil,居然还是找不到
    # 看看keys
    h.keys     # ==> {[1, 2, 3]} 似乎还在里面
    h[[1, 2, 3]] # ==> nil
    # 可是
    h          # ==> {[1, 2, 3]=>'A big object'},明明在这里,就是找不到

    h.rehash  # ==> 这样就会一切恢复正常。
   
    这一点上Python的设计要比较容易理解,list根本就是unhashable的,不能用来做hash的key。

        回过头来在说提高效率的事。Symbol效率提高还有第三个原因,那是因为symbol本质上不比一个整数多出多少东西,用Symbol#to_i可以得到一个在整个程序中唯一的整数。Hash完全可以利用这个整数来产生hash值,那岂不是比根据字符串内容去算hash值快得多?这还是小意思,既然这个整数是唯一的,那么产生一个唯一的hash值也就是小菜一碟,要是能保证hash值唯一,那还是什么hash表,根本就变成数组了。Hash表还可能会冲突,数组根本不会冲突,百分之百保证O(1),当然快。我没看Ruby源码,不知道是不是这么处理的。

5. 为什么Ruby runtime可以保证每一个symbol唯一?因为Ruby把symbol存放在运行时维护的一个符号表里了,而这个符号表实际上是一个atom数据结构,其中存储着当前所有的程序级的name,确保不出现内容相同的多个对象。几乎每一个语言和系统都会有这样一个符号表,只不过象C/C++那样的语言,这个符号表只是在编译时存在,运行时就没了。而Python、Ruby则在运行时也保留这张表备用。有这样一个现成的数据结构干嘛不用?

6. 但是这个表中存放的并不光是我们自己主动生成的symbols,还有Ruby解释器对当前程序进行词法分析、语法分析后存在其中的、当前程序的所有名字。这可是Ruby引擎用的东西啊,我们只要加上一个冒号,就让自己的对象跟Ruby引擎内部使用的对象成邻居了。所以String#intern这个方法叫做intern(内部化)。

   .NET Framework中String类也有一个Intern方法,意思是一样一样一样的,在李建忠的经典译本里翻译为“驻留”。

从《UML的三大硬伤》说起

这是Liu Junsong朋友给CSDN的来信,我转贴在此----------------------------------------------最近,在>杂志上发表了高展先生的一篇文章"UML的...
  • gigix
  • gigix
  • 2002-05-28 13:29:00
  • 2739

Ruby symbol String

Ruby的符号足以让很多初学者迷惑上一段时间,看过本章节后,或许会解开你心中的疑惑。 在Ruby中,一个符号是就是一个Symbol类的实例,它的语法是在通常的变量名前加一个冒号,如  :my_...
  • aabbcc456aa
  • aabbcc456aa
  • 2014-01-21 09:45:09
  • 756

[Ruby笔记]30.Ruby hash symbol 在哈希表中用符号作为键

reference 《The Well-Grounded Rubyist, Second Edition》 (https://www.manning.com/books/the-wel...
  • u014786849
  • u014786849
  • 2017-01-25 17:14:55
  • 471

理解 Ruby Symbol (Ruby中的冒号)

Symbol 是什么 Ruby 是一个强大的面向对象脚本语言(本文所用 Ruby 版本为1.8.6),在 Ruby 中 Symbol 表示“名字”,比如字符串的名字,标识符的名字。 创建一...
  • besfanfei
  • besfanfei
  • 2012-09-11 13:27:54
  • 19819

(转)Ruby之symbol研究

这是一个研究笔记,主要是为了向同好请教。除了这个开头以外,没有多余的废话,也就免了其他的客套。请大家不要抱怨可读性不好。1. 在一个名字或者字符串前面加上冒号,得到一个symbol对象。还可以通过St...
  • Last_Impression
  • Last_Impression
  • 2009-12-15 10:19:00
  • 634

ruby中的变量及其作用域

想着对比其他语言能加深我的理解吧,如果有理解错误还请指正! 1.类变量 @@name 这个在OC和 Java中我都是没有遇到过的,目前还没有学到Ruby的静态属性, 我理解为就是某个类的 实例...
  • sch1111878
  • sch1111878
  • 2017-03-02 15:47:25
  • 324

Ruby 符号与字符串及其转换(to_s and to_sym)

一、符号的定义 符号是Ruby内建类Symbol的实例,它们的标志是前导冒号。 :a :person :"Hello World" 二、字符串与符号可以相互转换 字符串转符号(to_sym...
  • life_is_crazy
  • life_is_crazy
  • 2017-04-17 11:55:16
  • 462

Ruby中的字符串与符号

初学Ruby的时候,往往对字符串(String类)与符号(Symbol)这两种变量类型分不清楚,其实,我们大可不必纠缠这两种变量类型的内部实现,只需记住它们的特点和区别就可以了:1. 字符串和符号,都...
  • joliny
  • joliny
  • 2007-09-25 22:09:00
  • 986

yaml资料的设置及ruby读取yaml数据

yaml文件的设置及ruby读取yaml数据 关于yaml的介绍可以查看IBM的 yaml介绍 ,这里主要讲述yaml格式的设置及如何使用ruby读取yaml数据 yaml数据设置 --...
  • lt_fina
  • lt_fina
  • 2012-11-21 14:35:28
  • 630

基于Ruby API的Sketchup模型导出研究与实现

http://www.doc88.com/p-901857529835.html
  • smart_graphics
  • smart_graphics
  • 2015-05-30 09:26:17
  • 666
收藏助手
不良信息举报
您举报文章:Ruby之symbol研究
举报原因:
原因补充:

(最多只允许输入30个字)