数据类型
标量
一个元素(数字或字符串)组成的变量
向量
多个元素组成的变量,有序
赋值
x<-
可重复赋值,后一次会覆盖前一次
> x<- c(1,2,3)
> x<- 1:10 # 1-10之间的所有整数
> x<- seq(1,10,by=0.5) #1-10之间每隔0.5取一个数
> x<-rep(1:3,times=2) #1-3之间的整数,重复两次
从向量中提取元素
- 根据位置
x[4] #x中的第四个元素
x[-4] #除了第4个之外的其他元素
x[2:4] #第2个到第4个元素
x[-(2:4)] #除了第2-4个元素
x[c(1,5)] #第1个、第5个元素
2.根据值
x[x==10] #等于10的元素
x[x<0]
x[x %in% c(1,2,5)] #存在于向量c(1,2,5)中的元素
数据框
- 需要读取的东西要放在工作目录下
获取示例数据框
x<-read.csv('doudou.txt')
view(x)
或者点一下environment里面的东西(=view(x)),左上角会出现数据
读取本地数据框
read.table(file="huahua.txt",sep="\t",header = T)
- sep
【以下内容以后用自R语言中的sep是什么意思】
sep 是函数的形式参数,多数情况下, seq 参数用来指定字符的分隔符号。
不仅用在你所提到的输出,也用在输入,也用在字符串的合并与拆分上。
csv 文件是用逗号分隔的,故而 sep = ","tsv 文件是用制表符分隔的,故而 sep = "\t"常用的分隔符还有空格 sep = " "
分隔符是任意的,可根据具体情况指定的。
- header=T意思是,数据中第一行是列名,如果没有列名就用 header=F
a<-read.table(file = "huahua.txt",sep="\t",header=T)
这里把hauhau.table赋值给a了,需要view(a)或者点一下environment里面的a,左上角可以看到
查看行名、列名,行数、列数
colnames(a) #查看行名
row.name(a) #列名
dim(a) #几行几列
数据框导出
write.table(a,file="yu.txt",sep=",",quote=F) #分隔符改为逗号,字符串不加双引号
原本的文档
重新保存的文档
多了行数
提取元素
以下代码引用自微信公众号生信星球
a[x,y]#第x行第y列
a[x,]#第x行
a[,y]#第y列
a[y] #也是第y列
a[a:b]#第a列到第b列
a[c(a,b)]#第a列和第b列
a$列名#也可以提取列(优秀写法,支持Tab自动补全哦,不过只能提取一列)
行
列,可以在前面加逗号也可以不加,不加的出来是竖着的,加了的出来是横的带引号
保存和重新加载
- 保存所有变量
save.image(file="bioinfoplanet.RData") #保存当前所有变量
这里我用【dir()】检查了下有没有存成功
文件夹里有一个类型是“R Workspace”的文件,属性是.RData
- 保存其中一个变量
save(a,file="test.RData")#保存其中一个变量
- 再次使用RData
load("test.RData")
回答问题:save(a,file=“test.RData”)这句代码如果报错object a not found,是为什么,应该怎么解决?
应该是a这个变量没有被读取,读取后再save可以解决。