带有基因名的火山图

现在很多文章开始出现这样的一种情况,在绘制火山图中,显示我们所关注的基因,那么如何去显示呢?很多人可能会这么做,在绘制普通的火山图之后,使用AI对图进行修改,添加部分基因,但是现在我要介绍的是如何用R绘制
library(ggpubr)
library(ggthemes)
data <- read.csv(“easy_input_limma.csv”, head=T,sep=’,’)
#绘制基本热图
data l o g p &lt; − − l o g 10 ( d a t a logp &lt;- -log10(data logp<log10(dataadj.P.Val)
ggscatter(data,x=“logFC”,y=“logp”)+theme_base()
在这里插入图片描述
#新增一列,选出上调和下调
data G r o u p = &quot; n o t − s i g n i f i c a n t &quot; d a t a Group=&quot;not-significant&quot; data Group="notsignificant"dataGroup[which((dataKaTeX parse error: Expected 'EOF', got '&' at position 16: adj.P.Val<0.05)&̲(datalogFC > 2))]=“up-regulated”
data G r o u p [ w h i c h ( ( d a t a Group[which((data Group[which((dataadj.P.Val<0.05)&(dataKaTeX parse error: Expected 'EOF', got '#' at position 32: …own-regulated" #̲查看上调和下调的基因个数 ta…Group)
#绘制新的火山图
ggscatter(data,x=“logFC”,y=“logp”,color=“Group”)+theme_base()
在这里插入图片描述
#添加颜色和点的大小
ggscatter(data,x=“logFC”,y=“logp”,color=“Group”,palette=c(
“blue”,“gray”,“red”),size=1)+theme_base()
在这里插入图片描述
ggscatter(data,x=“logFC”,y=“logp”,color=“Group”,palette=c(
“blue”,“gray”,“red”),size=1)+theme_base()+geom_hline(yintercept=1.3,
linetype=“dashed”)+geom_vline(xintercept=c(-2,2),linetype=“dashed”)
在这里插入图片描述
#新增一列,这一列是需要展示的基因名在这里我展示前10
data l a b e l = &quot; &quot; d a t a &lt; − d a t a [ o r d e r ( d a t a label=&quot;&quot; data&lt;-data[order(data label=""data<data[order(datalogp),]
#data S y m b o l &lt; − r o w n a m e s ( d a t a ) u p . g e n e &lt; − h e a d ( d a t a Symbol&lt;-rownames(data) up.gene&lt;-head(data Symbol<rownames(data)up.gene<head(dataSymbol[which(data G r o u p = = &quot; u p − r e g u l a t e d &quot; ) ] , 10 ) d o w n . g e n e &lt; − h e a d ( d a t a Group==&quot;up-regulated&quot;)],10) down.gene&lt;-head(data Group=="upregulated")],10)down.gene<head(dataSymbol[which(dataKaTeX parse error: Expected 'EOF', got '#' at position 31: …gulated")],10) #̲将up.gene和down.g…label[match(data.top.genes,dataKaTeX parse error: Expected 'EOF', got '#' at position 26: …data.top.genes #̲重新绘制 ggscatter(…label,font_label=8,repel=T)+theme_base()+geom_hline(yintercept=0.05,
linetype=“dashed”)+geom_vline(xintercept=c(-2,2),linetype=“dashed”)
在这里插入图片描述
很多人会说,这样的终究不太分明,我想让点的大小来反映FC,这样可以做到吗?当然可以了!如果有想了解的,可以试试,其实很简单的。

最近看到一个更加强大的包,绘制的火山图更加好看
EnhancedVolcano包
1、首先安装这个包
if (!requireNamespace(‘devtools’, quietly = TRUE))
install.packages(‘devtools’)
devtools::install_github(‘kevinblighe/EnhancedVolcano’)
加载包
library(EnhancedVolcano)
#res1是带有基因ID的列名,log2FoldChange是去过对数的差异倍数的列名,pvalue可以选择是校正前和校正后的,xlim是对log2FoldChange的范围进行限定
EnhancedVolcano(res1, lab = rownames(res1), x = ‘log2FoldChange’, y = ‘pvalue’,xlim = c(-5, 8))
绘制之后就是这样了
在这里插入图片描述
2、 还可以通过这个包直接修改点的大小和标签的大小
#title图片的名称, transcriptPointSize点的大小, transcriptLabSize标签的大小
EnhancedVolcano(res2,lab = rownames(res2), x = ‘log2FoldChange’,y = ‘pvalue’,
xlim = c(-8, 8),title = ‘N061011 versus N61311’,pCutoff = 10e-16,
FCcutoff = 1.5, transcriptPointSize = 1.5,transcriptLabSize = 3.0)
3、调整点的颜色和透明度
#colAlpha点的透明度,col是点的颜色,默认第一个是NS,第二个是log2FC,第三个是P,第四个是p&log2FC
EnhancedVolcano(res2, lab = rownames(res2),x = ‘log2FoldChange’,
y = ‘pvalue’,xlim = c(-8, 8),title = ‘N061011 versus N61311’, pCutoff = 10e-16,
FCcutoff = 1.5, transcriptPointSize = 1.5, transcriptLabSize = 3.0,
col=c(“grey30”, “forestgreen”, “royalblue”, “red2”), colAlpha = 1)
4、修改点的形状
shape点的形状,可以选择一个,也可以选择多个
选择一个形状
EnhancedVolcano(res2, lab = rownames(res2),x = ‘log2FoldChange’,
y = ‘pvalue’,xlim = c(-8, 8),title = ‘N061011 versus N61311’, pCutoff = 10e-16,
FCcutoff = 1.5, transcriptPointSize = 1.5, transcriptLabSize = 3.0,shape=4,
col=c(“grey30”, “forestgreen”, “royalblue”, “red2”), colAlpha = 1)
选择多个形状
EnhancedVolcano(res2, lab = rownames(res2),x = ‘log2FoldChange’,
y = ‘pvalue’,xlim = c(-8, 8),title = ‘N061011 versus N61311’, pCutoff = 10e-16,
FCcutoff = 1.5, transcriptPointSize = 1.5, transcriptLabSize = 3.0,shape=c(1,4,23,25),col=c(“grey30”, “forestgreen”, “royalblue”, “red2”), colAlpha = 1)
5、添加额外的阈值线,自定义阈值线,可以自己查看文档
hlineType线条的类型(平行于x轴),vline—是平行于Y轴的
cutoffLineCol线条的颜色,cutoffLineWidth线条的粗细
EnhancedVolcano(res2,lab = rownames(res2), x = ‘log2FoldChange’,y = ‘pvalue’,
xlim = c(-6, 6),title = ‘N061011 versus N61311’,pCutoff = 10e-12,FCcutoff = 1.5,transcriptPointSize = 1.5,transcriptLabSize = 3.0,colAlpha = 1,
cutoffLineType = ‘blank’,cutoffLineCol = ‘black’, cutoffLineWidth = 0.8,
hline = c(10e-12, 10e-36, 10e-60, 10e-84),
hlineCol = c(‘grey0’, ‘grey25’,‘grey50’,‘grey75’),
hlineType = ‘longdash’,hlineWidth = 0.8
,gridlines.major = FALSE,gridlines.minor = FALSE)
6、调整图例
#legend图例内容,legendPosition图例的位置,legendLabSize文字的大小
legendIconSize标签的大小
EnhancedVolcano(res2,lab = rownames(res2),x = ‘log2FoldChange’,y = ‘pvalue’,
xlim = c(-6, 6),pCutoff = 10e-12, FCcutoff = 1.5,cutoffLineType = ‘twodash’,cutoffLineWidth = 0.8,transcriptPointSize = 3.0,transcriptLabSize = 4.0,
colAlpha = 1,legend=c(‘NS’,‘Log (base 2) fold-change’,‘P value’, ‘P value & Log (base 2) fold-change’), legendPosition = ‘right’,legendLabSize = 16,legendIconSize = 5.0)
详细的请查看说明文档

好的,以下是使用 R 语言绘制差异基因火山的基本步骤: 1. 读取差异基因数据,包括基因称、表达值和差异值等信息; 2. 根据差异值和显著性水平筛选出差异表达的基因,通常选择差异值较大、显著性水平较低的基因; 3. 将筛选出来的基因分为上调和下调两组,并分别用不同的颜色标记; 4. 在坐标系上绘制基因的差异值和显著性水平,其中差异值一般使用 log2 转换,显著性水平使用负对数转换; 5. 将不同调控方向的基因用不同的颜色标记,同时可以设置阈值,将显著性水平高于阈值的基因用更亮的颜色标记; 6. 添加坐标轴标签、标题等注释信息。 下面是一个简单的 R 代码示例: ```R # 读取差异基因数据,例如:gene_name,log2_fold_change,p_value data <- read.table("diff_genes.txt", header = TRUE) # 筛选出差异表达的基因 diff_genes <- subset(data, abs(log2_fold_change) > 1 & p_value < 0.05) # 将上调和下调的基因分别用不同的颜色标记 up_genes <- subset(diff_genes, log2_fold_change > 0) down_genes <- subset(diff_genes, log2_fold_change < 0) # 绘制火山 plot(-log10(diff_genes$p_value), diff_genes$log2_fold_change, pch = 20, col = ifelse(diff_genes$log2_fold_change > 0, "red", "blue"), main = "Differential Gene Expression", xlab = "-log10(p-value)", ylab = "log2(fold change)") # 添加阈值和注释信息 abline(h = c(-1, 1), lty = 2) text(-log10(diff_genes$p_value), diff_genes$log2_fold_change, labels = ifelse(diff_genes$p_value < 0.01, rownames(diff_genes), ""), cex = 0.6, pos = 4) legend("topleft", legend = c("Up-regulated", "Down-regulated"), col = c("red", "blue"), pch = 20) ``` 以上代码仅供参考,具体细节还需要根据实际数据进行调整。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值