Gfold

本文介绍了如何使用R语言处理基因表达数据,主要关注GFOLD值来鉴定差异基因。当GFOLD值大于0时,表示case组高表达;小于0则表示case组低表达。通过设定阈值,可以控制筛选出的差异基因数量。同时,使用awk命令筛选出上调和下调基因,以及两倍差异基因。
摘要由CSDN通过智能技术生成

主要一共7列信息
前两列gene symbol和gene name
第三列是GFOLD值,相当于log2(Fold Change),该值等于0的基因则记为非差异基因,非0的值才是差异基因
第四列E-FDR是基于重复的Empirical FDR,因此无重复样本的经验FDR均为1。
Log2fdc以及后面的RPKM列可以忽略考虑,因为最开始的exon的长度,我们是给定的是一个虚拟的数据。所以真正的确定差异是否显著,主要是看GFOLD值,GFOLD>0,代表case组中高表达,GFOLD<0,代表case组中低表达。后续筛选差异基因如果太多或者太少,我们也可以通过设定GFOLD的阈值来控制,比如设定<-0.3或者大于0.3。

作者:凯凯何_Boy
链接:https://www.jianshu.com/p/1a3114ea7662
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

在R中统一格式
代码来源于简书作者没有猫但是有猫饼的文章

#新生成的文件名我一般不改,就是 raw_data_Vec , raw_data_LSH 反正后面还会改掉
file1 = "SRR79.csv" 
raw_data_LLs <- read.csv(file1, stringsAsFactors=FALSE,encoding="UTF-8")
file2 = "SRR81.csv" 
raw_data_LWs<- read.csv(file2, stringsAsFactors=FALSE,encoding="UTF-8")
#统一列名别出错 
colnames(raw_data_LLs) <- c("GeneSymbol","GeneName","Read Count","Gene exon length","RPKM")
colnames(raw_data_LWs) <- c("GeneSymbol","GeneName","Read Count","Gene exon length","RPKM")
#导出文件,这个文件名我也不改,不然在 Linux 里改好麻烦
write.table(raw_data_LLs, file="C:/Users/86187/Documents/SRR10251179.csv", row.names=F, col.names=F, quote=F, sep="\t") 
write.table(raw_data_LWs, file="C:/Users/86187/Documents/SRR10251181.csv", row.names=F, col.names=F, quote=F, sep="\t")

gfold处理

/data/00/user/user159/wm/gfold.V1.1.4/gfold diff -s1 /data/00/user/user159/wm/gfold.V1.1.4/SRR10251179 -s2 /data/00/user/user159/wm/gfold.V1.1.4/SRR10251181 -suf .read_cnt -o sample79VSsample81.diff 

下面展示一些 内联代码片

#大于0为上调,小于0下调(第3列是gfold值所在列,第4列是E值)
awk '{if($3>0 && $4=1) print $0}' sample69VSsample80.diff OFS='\t' > up_diff.gene
awk '{if($3<0 && $4=1) print $0}' sample74VSsample77.diff OFS='\t' > down_diff_7477.gene

#筛选两倍差异基因,即大于1和小于-1的
awk '{if($3>1 && $4=1) print $0}' sample74VSsample77.diff OFS='\t' > up_diff_7477.gene-2
awk '{if($3<-1 && $4=1) print $0}' sample74VSsample77.diff  OFS='\t' > down_diff_7477.gene-2
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值