在大二就已经开始学R了,但是一直没有一篇总结的文章,今天顺便上来总结一下R语言的快速上手命令,以备日后翻阅。
- R的介绍
- R的基本操作
- 基本数据类型
- 数据操作
- 语法
- 绘图操作
- 一些包的介绍
一、R的介绍
R是一种开源而且免费的软件。在统计学家中比较流行,它轻巧简便,约43M(相比matlab光是安装包就要接近8G)。R官网上还有许多已经开发好的包,可以直接下载来调用。R在统计功能上更加强大,
R的下载和安装在这里不阐述,网上有比较多的指南。在这里,我使用了R的一款很友好的IDE-——Rstudio。原始的R界面非常的简洁,但是不利于编程,而Rstudio是仿照matlab的用户界面,用起来比较方便。
二、R的基本操作
- 系统设置
R的注释符号是#
rm(list=ls())#清理系统内存,还可以用ctrl+L清空命令窗口
options(digits=4)#设定输出数的位数
par(mar=c(4,4,2,1)+0.1,cex=0.8)#绘图时使用,相当于把绘图界面分成4份
- 读取数据
data=read.csv('“数据网址”')
data=read.table('clipboard',header=T)#用clipboard比较方便,#只需要复制需要读取的数据,然后执行这条命令即可
包的安装和载入
包的安装有两种方式:一是直接用install.packagea(“包名”),二是在Rstudio上有选项可以安装。点击Package内的install可以安装,会有下一步的提示
例如我想装ggplot2包,点击“install”即可
包的载入:library(包名)
library(ggplot2)
基本数据类型
先介绍一下R中的数据类型:向量、矩阵、数组、列表、因子、数据框
R的数据对象:数值型、字符型、逻辑型、日期型等,还有缺失值(not available,NA)
向量
- 赋值
x=c(1,2,3,4,5)
assign('x',c(1,2,3,4,5))#等价于上一条语句
- 运算
> x=c(1,2,3,4);y=c(7,8,9,4)#注意'>'不要加进去,这只是命令提示符
> v=2*x+y+1;v#向量之间可以进行加减乘除,就是对应分量运算
[1] 10 13 16 13
> exp(x)
[1] 2.718282 7.389056 20.085537 54.598150
> sqrt(y)
[1] 2.645751 2.828427 3.000000 2.000000
- 相关函数
> x=c(10,11,6,9,5)
> min(x)#求最小值
[1] 5
> max(x)#求最大值
[1] 11
> range(x)#求极值
[1] 5 11
> which.min(x)#求最小值的“索引”(位置)
[1] 5
> which.max(x)#求最大值的“索引”(位置)
[1] 2
> sum(x)#对向量求和
[1] 41
> length(x)#求向量的长度
[1] 5
> sort(x)#对向量x从小排序
[1] 5 6 9 10 11
> median(x)#求中位数
[1] 9
- 逻辑向量
> x
[1] 10 11 6 9 5
> a=x<8
> a#a是逻辑值
[1] FALSE FALSE TRUE FALSE TRUE
- 字符型向量
> y=c("er","ss","jk","dim")
> y
[1] "er" "ss" "jk" "dim"
> paste("Hello",",","World")#把字符串连接成一个字符串
[1] "Hello , World"