3.3 不能向量化
有一些操作是不能被向量化的.比如,如果当前迭代建立在上一次迭代的结果上,这样的情况下向量化没有用武之地.(但是一些情况被filter(),cumsum()掩盖了,等等.)
如果你确实需要使用一个循环,那就让它尽可能简洁:
尽可能将更多地操作放在循环之外.例如:如果一个相同或者相似的的序列在每次循环都会被创建,那就在循环开始前首先创建它并且重复使用.创建一个序列是非常快速的,但是如果创建成千上万次的话那就是一笔昂贵的时间开销了.
尽可能将循环的次数变少.如果你在一个因素的元素层面进行迭代或者在这个因素的级别层面进行迭代之间可以选择的话,那就在它的级别层面进行迭代,几乎可以肯定的是,这样更好.
下面的代码返回矩阵的每一列元素之和(假设列的数量是正数):
sumxcol <- numeric(ncol(x))
for(i in 1:ncol(x)) sumxcol[i] <- sum(x[,i])
一个更普遍的方式肯能是这样的:
sumxcol <- apply(x, 2, sum)
除了这种常用的方法外,下面的代码是在R代码中没有包含循环的做此类操作的特殊的函数:
sumxcol <- colSums(x)
当然还有函数rowSums(),colMeans(),rowMeans().
另外一个方式是:
# %*%为求矩阵内积
sumxcol <- rep(1, nrow(x)) %*% x
这种方法用了矩阵的数乘,稍微动一下脑筋很多问题就会被蹂躏成矩阵数乘的形式.这确实是一个有效的替代方法.