R有一个非常强大的矩阵计算的方式,可以避免控制流循环带来的高错误率以及漫长的响应时间。
这里就涉及到一个数据转换的模式:split-apply-combine (图简单,接下来都简称SAC了)。
大神曾就这个模式开发出了plyr包,并写了一篇文章叫The Split-Apply-Combine Strategy for Data Analysis. 有兴趣不妨一读。
下面写的是我了解的跟以上SAC理念相关的R的函数,从基础split说起,这也是SAC这个概念的起点,任何类似的数据支持大致都是从split开始。
split函数主要用于将一组数据以一定的规则分组并返回一个list。split还有一个配对的函数upsplit,这是split的逆向操作。
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-
-+-