一直听其他人鼓吹R语言是如何神奇,将如何推进大数据时代的发展,这些天抱着将信将疑的心理尝试了一下R,顺便记录了一些学习经历和遇到的一些问题,方便以后翻阅。
一、R的安装
二、R中的数据类型
与其说R是一种面向对象或函数式的编程语言,不如说是一种面向数据的语言更为贴切,因为R语言就是为数据处理和分析而生的,从R的数据类型的定义我们就能感受到这点。R中是没有原子数据的,数据都存在于向量或其扩展结构中,所有R中的向量也被称为原子向量。
举个简单的例子:
x <- 1
这个赋值语句会生成一个数字向量,其中包含一个元素。向量这个基础结构就类似C,Java里的数组类型,向量中所有元素都必须同一类型,R 中叫做模式,这个跟数据库中数据模式的概念很像。
R 中的数据模式主要有:
numeric
character
boolean
complex
list
function
...
R 中数据对象内的元素有模式,并且数据对象本身还具有类型,R 中的类型其实就是一个class属性(一个字符型向量),这个是R实现面向对象程序设计的基础。
三、常用函数
1. 数据生成函数
c rep seq matrix array list
2. apply 系列函数
apply tapply lappily sapply
3. un...系列函数
unname unclass unlist
4. 数学函数
mean median var cov sd sum prod
cumsum cumprod
5. 属性相关函数
attr attributes
mode typeof class names length getClass
四、数据预处理
五、面向对象
S3
S4
六、数据库连接
RODBC
七、基本作图
八、统计模型
1. 模型公式
九、书籍推荐
《The art of R programming》
《R in action》