**
常用函数
**
没有标注执行结果,一起来敲一敲回忆一下吧~~
筛选
c(1:10)>4
table(c(1:10)>4)
⚠️ c是一个函数,在命名时不要将c命名为一个变量/数据集的名称!!!!
创建/赋值
a=read.table('Desktop/工作/2-生物信息学/R语言/2-文件导入导出/practice-20220117',skipNul = T,header = T) # 还记得read.table是什么函数不?
b = matrix(rnorm(200), 20, 10)
c = matrix(rnorm(200), 20, 10) # 不可以这样命名!!!!!!
查看
View(a) # 查看数据集a的完整内容
dim(a) #查看变量有多少行、多少列
head(test) #查看数据集前6行
热图
pheatmap(a) # 将数据集a画成热图
更多pheatmap相关可以参考同专栏中文章[《生物信息学技能学习--热图》](https://blog.csdn.net/weixin_43664814/article/details/128910934?spm=1001.2014.3001.5501)
文件处理
# 保存文件
save(b,file='save_doc.Rdata') # 将b保存为一个Rdata文件
# 导出文件
load(file='Desktop/工作/2-生物信息学/R语言/2-文件导入导出/save_doc.Rdata') # 将文件导入到执行目录,并执行文件名称和类型
数值计算
# 行的平均值
rowMeans(b)
# 行最大值
apply(b,1,max)
# 行最小值
apply(b,1,min)
# 取方差
sort(apply(b,1,sd),decreasing = T)[1:50] # 从小到大取1-50的方差 sd:方差
# 取随机数
sample(1:nrow(b),50)
# 排序
sort(apply(b,1,max)) # sort 从小到大排
循环
# for循环
for (i in 1:nrow(b)){
print(mean(as.numeric(b[i,])))
}
# apply针对矩阵和数据宽的循环,apply将循环进行了包装
apply(b,1,function(x){
mean(x)
})
定义函数
# 定义函数:将取行最大值的操作定义一个函数
rowMax = function(){
apply(x,1,max) #x是一个变量,在需要操作时传入x的值
}
# 使用函数:取b行的最大值
rowMax(b)