R语言函数的简单理解

最新推荐文章于 2024-03-07 06:00:00 发布

NewthingX

最新推荐文章于 2024-03-07 06:00:00 发布

阅读量5.4k

点赞数 1

分类专栏： R 文章标签： R函数超赋值运算符 assign 函数式编程面向对象编程

本文链接：https://blog.csdn.net/u013259893/article/details/40557101

版权

R 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

R语言结合了面向对象编程语言和函数式编程语言的特性，由于拥有函数式编程的特性，R的每一个运算符，实际上也是函数，同样，面向对象的特性决定了你接触到的R中所有东西(从数字到字符串到矩阵等)都是对象。这些综合的特质决定了R这门语言的特殊性，最大的特点就是开源，R中有许多用户无私贡献的包，通过这些包，可以实现强大的功能，因此，在在的统计处理或者数据挖掘等数据处理相关工作中，R常常作为数据预处理和建立初步模型的强大工具，但作为一门解释型语言，R的运行效率比不上同等下的C等编译型语言，特别是在高性能计算中。因此，个人认为未来或者是现在将流行这样一种数据处理方式:用R对数据进行预处理，同时通过R建立初步的数据处理模型，待对模型进行评估并确定如何实施之后通过更高效的语言(C语言等)来实现。

R中变量作用域的层次结构同C语言类似，但最大的不同在于，在R函数中可以创建新的函数，这样会增加新的层次。

R拥有函数式编程的特性，基于函数式编程语言的特征，函数不会修改非局部变量，在R中，函数几乎没有副作用，简单的理解为，函数的一般代码可以读但是不能写非全局变量(当然通过特定函数是可以修改全局变量的)。一般代码表面上可以给全局变量重新赋值，但实际上这些操作只会修改全局变量在特定层次中的备份，而全局变量本身不会发生变化。如下面例子所示：

i <- 1
test <- function(){
   i <- 2
   print(sprintf("the value from test(): %i", i))
}
test()
print(sprintf("the value from global:%i", i))

执行以上代码，结果如下所示:

在以上代码中，i是全局变量，顺序执行test()函数，在test中给i赋值为2，此时打印的结果是局部变量中的值。test()函数执行完之后再打印i的值，结果却仍然是1，说明test中的赋值并没有修改全局变量i。

一般情况下，使用R中的函数不会有副作用，可以有以下几点理解:1)只引用而不改变全局变量，局部变量与全局变量共享内存空间，此时的值必然相同；2)一旦函数对全局变量重新赋值，系统将会创建一个与全局变量同名的新变量，并为这个变量分配新的内存空间，但这个新变量只处在宿主函数这个层次中，根据变量的引用关系，优先引用离自己较近的本层或者上层环境中变量，所以在该函数中基本上只会用全局变量的同名局部变量了；3）随着函数调用结束，系统会释放函数中的局部变量，新创建的全局变量的同名局部变量也将销毁，而全局变量的值并没有因为在函数中使用而发生变化。

当然，R中也提供了特定的函数来对函数的上级层次进行写操作，那就是<<-和assign()。

1.超赋值运算符<<-的机理为:使用<<-进行赋值操作，系统会从第一个上级层次开始，由低到高逐层进行查找，直到在某个层次中找到该变量，如果找不到该变量，系统会在顶层环境中创建一个新的变量。注意，超赋值运算符<<-只查上级，不会对本级进行查找。

如下例所示:

i <- 1
testA <- function()
{
   i <<- 2
   print(sprintf("the value from testA(): %i", i))
}
testA()
print(sprintf("the value from global:%i", i))

testB<-function()
{
   i<<-2
   print(sprintf("the value from testB(): %i", i))
}
testB()
print(sprintf("the value from global:%i", i))

结果如下:

两次运行的结果相同，在A)中，<<-修改了全局变量值i，在testA函数中引用了修改后的值，结果为2，在B)中，<<-向上查找，没有找到名为i的全局变量，但是系统在全局环境中创建了名为i的全局变量并为其赋值为2。

2.使用assign()函数来对非局部变量进行写操作，该函数的特性为:向指定层次(本级或上级)中的某个变量赋值，有则修改，无则创建。

如下代码所示:

test <-function()
{
    i <- 1 
    innertest<-function(x)
    {
         i<-3
         assign("i",2*x,pos=.GlobalEnv)
         print(sprintf("the value from innertest(): %i",i))
  }
  innertest(5)
  print(sprintf("the value from test(): %i", i)) 
}
test()
print(sprintf("the value from global:%i", i))

结果为:

由结果可知，在test()和innertest()中的i值都没有发生变化，而在最顶层的全局层次中没有定义i的值，结果显示该值为10。原因在于，在函数test()内部定义的函数innertest()中执行了assign函数，该函数在最顶层全局层次中的变量i赋值10，但是该层中并没有该变量，于是就就在最顶层.GlobalEnv中创建了该变量i并给其赋值，这样在不同的函数层次中都有变量i，优先引用离自己最近的同级(已顺序执行)或者上级层次中的变量，所以i出现了三个不同的输出值。

参考:

[1] Norman Matloff著，陈堰平等译.R语言编程艺术.机械工业出版社,2013-05

[2] http://www.r-project.org/index.html

NewthingX

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
R语言函数的简单理解

R语言结合了面向对象编程语言和函数式编程语言的特性，由于拥有函数式编程的特性，R的每一个运算符，实际上也是函数，同样，面向对象的特性决定了你接触到的R中所有东西(从数字到字符串到矩阵等)都是对象。这些综合的特质决定了R这门语言的特殊性，最大的特点就是开源，R中有许多用户无私贡献的包，通过这些包，可以实现强大的功能，因此，在在的统计处理或者数据挖掘等数据处理相关工作中，R常常作为数据预处理和建立初步
复制链接

扫一扫