R语言学习(R语言实战) —2019.11.06
这学期的专业课开了商务智能与数据挖掘,觉得学习R还是很有必要的,于11月6日开始,希望快速熟悉。在使用python时觉得数据的导入转换较为困难,R据说可以提供简单有效的方法,来康康叭。
1.开始学习啦
1.1安装
在http://cran.r-project.org/安装
1.2大体上来讲…
- R语言区分大小写
- 在>后输入一条命令 或者 执行脚本(一组命令)。
- 万物为对象
- 函数有的默认使用,有的高级的需要加载包
- R语句由函数以及赋值构成,赋值:->或者<- 箭头指向变量名。
1.3工作空间
- 存储用户定义的所有对象
- 保存工作空间到一个镜像以便下次找到他
- 读取保存文件:
- getwd() 显示默认路径
- setwd() 修改默认路径
- dir.create()创建目录
- save.image("myfile")保存工作空间到文件中
- save(ob,file="myfile")保存指定对象到文件中
- load("myfile")读取一个工作空间到当前会话
- q()退出R
总之,保存用save且要说明保存到哪个文件,载入用load,退出用q。
注意:修改路径时要保证目录存在,若不存在要先新建。路径书写用正斜杠/
1.4输入输出
- 输入:可以执行脚本(文件名后缀为.R)语句为
source("filename.R")
- 文本输出:
sink("filename")
,默认输出结果覆盖文本,加参数append=TURE
将结果追加到文本;加参数split=TURE
,将结果输出发送到屏幕和文件。 - 屏幕输出:
sink()
,没有任何参数 - 图形输出:需要两步,一步:以文件类型为函数名,例如
pdf("filename.pdf")
;二步:dev.off()
- 一般先sink,pdf再source
1.5包的下载使用
- 安装:
install.packages("包名")
- 更新:
update.packages("包名")
- 载入:
library(“包名”)
- 查询使用方法:
help(package="包名")
2.创建数据集
2.1数据集的概念
数据集是由数据构成的矩形数组,行表示观测,列表示变量。每一列有对应的数据类型(模式),如数值型、字符型、逻辑型、复数型、原生型(字节)。
2.2数据结构
- 标量:用于保存常量
- 向量:保存同种数据类型的数据,用函数c()创建;
访问元素:(三种方式)
> a<- c(1,2,3,4,5)
> a[1]
> 1
> a[c(1,3,5)]
> 1 3 5
> a[2:5]
> 2 3 4 5
- 矩阵:是二维数组,用函数matrix()创建,
matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE,dimnames = NULL)
获取元素:x[i,]行 x[ ,i]列 x[i,j]第i行第j列的元素(都不算0)
【注】默认按照列填充,因为NA是个向量,所以矩阵只能含有同一种数据类型的数据。 - 数组:维数超过2,用函数array()创建;
array(data = NA, dim = length(data), dimnames = NULL)
【注】因为是矩阵的扩充,所以同样只能含有同一种数据类型的数据。 - 数据框:同样是二维的,但它不同的列可是不同的模式的数据,常用 。通过data.frame()创建,选取列的方法,可以按照下标记号,也可以按照列名。若指定一列:框名$列名
and 每天更新一章…