R语言
文章平均质量分 78
这是一个用R语言解决难题的栏目
还是要前进啊
一个喜欢生信的人
展开
-
R语言:单细胞:挑选PC分群聚类
pdf(file = "聚类后UMAP.pdf",width =6.5,height = 5.5)> pdf(file = "聚类后TSEN.pdf",width =6.5,height = 5.5)> pdf(file = "前20个PC热图.pdf",width =7.5,height = 9)> pdf(file = "挑选分辨率.pdf",width =12,height =10)> pdf(file = "聚类热图.pdf",width =22,height = 16)#选择分辨率进行降维。原创 2024-05-21 20:59:57 · 1078 阅读 · 0 评论 -
R语言:lasso筛选基因
setwd("D:/28.lasso筛选基因")原创 2024-05-17 20:36:43 · 525 阅读 · 0 评论 -
R语言:单细胞鉴定高变基因
pdf("标记前10高变基因.pdf")##标准化LogNormalize。> pdf("高变基因.pdf")# 提取前10的高变基因。原创 2024-05-16 20:48:57 · 306 阅读 · 0 评论 -
R语言:单细胞数据质控
mask2 <- seurat$nFeature_RNA >= 200 & seurat$nFeature_RNA <= 10000 #每个细胞中检测到的基因数量。> seurat[["percent.mt"]] <- PercentageFeatureSet(seurat, pattern = "^MT-")#线粒体基因。> seurat[["percent.rb"]] <- PercentageFeatureSet(seurat, pattern = "^RP")#核糖体基因。原创 2024-05-16 20:48:01 · 921 阅读 · 0 评论 -
R语言:cox分析列线图
title="",rank="sd",学习交流一下。原创 2024-05-15 22:15:00 · 1024 阅读 · 0 评论 -
R语言:GO和KEGG分析
id.fc=rtdev.off()> id.fc=rt。原创 2024-05-15 21:15:00 · 1845 阅读 · 0 评论 -
R语言:热图,火山图
不太好看。g> g2交流学习。原创 2024-05-14 20:52:21 · 1164 阅读 · 0 评论 -
R语言:多因素cox
head(rt)#cox模型建立head(cox)原创 2024-05-14 20:51:52 · 911 阅读 · 0 评论 -
R语言:瀑布图的绘制
> library(maftools) > maf = read.maf(maf = 'combined_maf_value.txt') > pdf(file="waterfall.pdf",width=7,height=6)> oncoplot(maf = maf,top = 30, fontSize = 0.8 ,showTumorSampleBarcodes = F )> dev.off()> pdf(file="waterfall-gene.pdf",width=7,原创 2024-05-14 20:19:33 · 500 阅读 · 0 评论 -
R语言:ROC分析
inputFile="结果.txt"结果不好,但过程可以学习。原创 2024-05-14 20:18:50 · 356 阅读 · 0 评论 -
R语言:肿瘤突变负荷分析
通过lapply循环去读每一个样本的maf,然后通过rbind合并成矩阵,按行来合并。#通过合并path,还有sample sheet前两列得到每一个文件的完整路径。#替换.为下划线,转换成小写,sample_id替换成sample。函数,计算了基于 MAF 数据的肿瘤突变负荷(TMB)。#定义去除重复样本的函数FilterDuplicate。#删掉最后一列sample_type中的空格。#调用merge_maf函数合并maf的矩阵。#读入maf的sample sheet文件。#保存合并后的maf文件。原创 2024-05-13 20:33:42 · 678 阅读 · 0 评论 -
R语言:GSEA分析
安装软件包> if (!#加载软件包#设置变量> head(rt)head(rt))\\-(.*?)\\-(.*?#排序#GESA分析dev.off()dev.off()一起学习交流。原创 2024-05-13 19:04:49 · 912 阅读 · 0 评论 -
R语言:r做pcoa分析
geom_vline(xintercept = 0, color = 'gray', size = 0.4) + # 在0处添加垂直线条。+ geom_vline(xintercept = 0, color = 'gray', size = 0.4) + # 在0处添加垂直线条。+ geom_vline(xintercept = 0, color = 'gray', size = 0.4) + # 在0处添加垂直线条。> # 将 p2 放在第二行第一列。原创 2024-05-09 08:15:00 · 1399 阅读 · 0 评论 -
R语言:r画韦恩图
ggsave("韦恩图.png", plot = p1, width = 10, height = 8, dpi = 150)+ text = element_text(size = 16) # 设置字体大小为 16。分辨率高了很多,这只是最基本的用法,想要画一个好图,得需要多次修改。> data <- read.xlsx("韦恩图种2.xlsx")原创 2024-05-08 20:48:44 · 863 阅读 · 0 评论 -
R语言:卡方检验
χ2统计量衡量了观察值与期望值之间的偏差程度,它的计算公式为:χ2 = Σ [(观察频数 - 期望频数)^2 / 期望频数]。需要注意的是,P值(显著性水平)小于0.05,这意味着我们可以以95%的置信度拒绝零假设,即男性和女性病例的阳性率之间存在显著差异。我们看到这个数据男性阳性人数为1507,阴性为1126,女性阳性为1429,阴性为971,我们使用卡方检验看一看阳性率是否在性别上存在差异。这个意思是根据给定的数据,对比了男性和女性病例的阳性率,并进行了χ2检验来评估两者之间的差异是否具有统计学意义。原创 2024-05-07 19:56:24 · 1016 阅读 · 0 评论 -
R语言:ggplot2做柱状图,随机生成颜色。
write.table(palette, file = "30genus color.txt", sep = ",") #记录随机生成的颜色。"Lactobacillus crispatus", "others"))#对种类图形元素排序,保证图形是从大向小排。> data_draw<-melt(mydata,id.vars='species')#转换数据。legend.position = "right", # 在这里设置图例位置。> mydata <- read.xlsx("读取.xlsx")原创 2024-03-19 21:30:00 · 1289 阅读 · 0 评论 -
R语言:vagen包做微生物香农指数分析,ggplot2画箱线图
write.table(alpha,"alpha.csv",row.names=T,col.names=TRUE,sep=",") #保存数据。> alpha=data.frame(shannon,simpson,check.names=T) #合并数据为数据框。> simpson=diversity(otu,"simpson") #计算辛普森指数。> df <- read.xlsx("a.xlsx") #在excel中整理了数据。) #加入两组差异比较,使用t.test。看来都没有显著差异。原创 2024-03-22 08:36:51 · 1184 阅读 · 0 评论 -
R语言包:microeco:一个用于微生物群落生态学数据挖掘的R包:第五:trans_diff class
差异丰度检验是微生物群落数据分析的重要组成部分。它可以用来确定群落间差异的重要分类群。目前,trans_diff类有三种著名的方法来进行这种分析:metastat、LEfSe和random forest。这里我们介绍random forest 方法。# 然后,我们给出了分类树中差异特征的梯形图。这个数据集中的分类群太多了。# 作为一个例子,我们只使用了树中最丰富的200个分类群和50个差异特征。# 我们只在门级显示完整的分类标签,在其他级别使用字母来减少文本重叠。#需要调用ggtree。原创 2024-03-15 08:25:35 · 1457 阅读 · 0 评论 -
R语言:microeco:一个用于微生物群落生态学数据挖掘的R包:第七:trans_network class
函数cal_sum_links()用于对从一个分类单元到另一个分类单元或同一分类单元中的链接(边)数求和。# 函数cal_sum_links()用于对从一个分类单元到另一个分类单元或同一分类单元中的链接(边)数求和。# 对于本教程中的“门”级别,函数cal_sum_links()将从一个门到另一个门或同一门中的连杆数求和。# 对于本教程中的“门”级别,函数cal_sum_links()将从一个门到另一个门或同一门中的连杆数求和。#现在,我们用门的信息显示节点的颜色,用正相关和负相关来显示边缘的颜色。原创 2024-03-18 20:00:00 · 1513 阅读 · 0 评论 -
R语言:microeco:一个用于微生物群落生态学数据挖掘的R包,第六:trans_nullmodel class
近几十年来,系统发育分析和零模型的整合通过增加系统发育维度,更有力地促进了生态位和中性影响对群落聚集的推断。trans_nullmodel类提供了一个封装,包括系统发育信号、beta平均成对系统发育距离(betaMPD)、beta平均最近分类单元距离(betaMNTD)、beta最近分类单元指数(betaNTI)、beta净相关指数(betaNRI)和基于bray - curtis的Raup-Crick (rbray)的计算。系统发育信号分析方法基于地幔相关图,与其他方法相比,系统发育信号的变化直观、清晰。原创 2024-03-16 10:56:28 · 953 阅读 · 0 评论 -
R语言:microeco:一个用于微生物群落生态学数据挖掘的R包,第六:trans_env class
环境变量在分析微生物群落结构和组装机制方面是非常有用的。我们首先展示RDA分析(db-RDA和RDA)。# 在本例中,我们首先进行了差异丰度检验和随机森林分析,以获得重要属。然后利用这些分类群进行相关性分析。图画的有些难看,这是临时跑的,大家有需求的话可以用自己的数据跑一下。没需求就跑着玩,熟悉一下就好。# 环境变量与分类群之间的相关性对分析和推断群落结构的影响因素具有重要意义。#Mantel检验可以检验环境变量与距离矩阵之间是否存在显著的相关关系。原创 2024-03-15 19:22:05 · 1113 阅读 · 0 评论 -
R语言:microeco:一个用于微生物群落生态学数据挖掘的R包,第八:trans_func class
microeco就先分享到这里,这个包比较复杂,我只是分享了部分,想要学习,得从事具体的项目。# 生态学研究人员通常对微生物群落的功能特征感兴趣,因为功能或代谢数据对于解释微生物群落的结构和动态以及推断其潜在机制是强有力的。# 对原核生物的性状和特征进行的汇总。我们将原核生物的分类信息与该数据库进行比对,以确定原核生物在生物地球化学作用上的特征。# 这些工具可以很好地用于基于测序结果的原核生物群落的功能谱预测。# 由于宏基因组测序复杂且昂贵,利用扩增子测序数据预测功能谱是一个很好的选择。原创 2024-03-19 08:50:09 · 1090 阅读 · 0 评论 -
R语言:microeco:一个用于微生物群落生态学数据挖掘的R包,第四:trans_beta class
这个包的改动有些大,以前的代码不能直接跑了。我发觉,学习这个包还是要基于需求啊,否则会很快忘掉。以前我使用vegan包分析+ggplot2包做PCOA分析,等把这个包分享完了,我会再分享其它的R语言。程辑包‘agricolae’是用R版本4.3.3 来建造的 #这里需要安装agricolae包,直接install就行。#这里应该会有差异比较的,但是却没有。示例如下,不知道有什么问题,等到有需求我会解决这个问题。#perMANOVA常用于组间距离的差异检验。# 聚类图也是一种常用的方法。原创 2024-03-14 08:56:56 · 1233 阅读 · 0 评论 -
R语言:microeco:一个用于微生物群落生态学数据挖掘的R包,第三,trans_venn class和trans_alpha class
这次我们分享,trans_venn类用于venn分析。trans_alpha class,Alpha多样性可以使用trans_alpha类进行转换和绘制。今天,我发现一个很尴尬的问题,就是这个包更新了,兄弟以前的代码不能直接跑了。这些都是我跑完之后分享的,大家可以先跑。为了分析组的唯一otu和共享otu,我们首先根据sample_table中的“Group”列合并样本。#现在,让我们绘制每个组的alpha多样性的平均值和se,并添加duncan。#当组数过多,无法用维恩图表示时,可以用花瓣图表示。原创 2024-03-13 20:32:04 · 1132 阅读 · 0 评论 -
R语言microeco:一个用于微生物群落生态学数据挖掘的R包(构建microeco对象。
在sample_table的rownames和otu_table的colnames中,所需的样例名称必须相同。分类群丰度图,维恩图,Alpha多样性,Beta多样性,差异丰度分析,环境数据分析,零模型分析,网络分析,功能分析。然后,为了使otu_table、tax_table和phylo_tree中的otu相同,我们再次使用tidy_dataset()。为了使物种和样本信息在数据集对象的不同文件中保持一致,我们可以使用函数tidy_dataset()来修剪数据集。然后,我们计算alpha分集。原创 2024-03-12 19:49:09 · 3541 阅读 · 0 评论 -
R语言microeco:一个用于微生物群落生态学数据挖掘的R包,第二讲(trans_abund class)
t1$plot_bar(others_color = "grey70", facet = "Group", xtext_keep = FALSE, legend_text_italic = FALSE) #出现门水平的柱状图。上次我们分享了microeco对象的构建与数据前处理,这次分享microeco包的trans_abund class,该类用于转换分类丰度数据,以便使用ggplot2包绘制分类群丰度。好了,今日先分享到这里,还有一些图,我遇到了bug,暂时无法解决,我以前却没有遇到。原创 2024-03-13 08:27:15 · 688 阅读 · 0 评论