不用linux转录组数据分析,没有生物学重复的转录组数据怎么进行差异分析?

本文介绍了在没有生物学重复的转录组数据情况下如何进行差异分析。方法包括:1) 根据foldchange直接筛选;2) 使用edgeR包,需要人为指定dispersion值;3) 使用Gfold软件,该软件专门用于无重复样本的差异基因鉴定。对于Gfold的安装和使用进行了详细步骤说明,并指出差异基因的显著性主要看GFOLD值。
摘要由CSDN通过智能技术生成

设置生物学重复这个环节也是你实验设计很重要的一part,设置的好对你下游分析也有利,通常我们做转录组测序,需要的样本量每组至少为3个生物学重复,这个处理起来就很合理,并且现在流行的差异分析软件DEseq2,limma,edgeR等等都是针对有重复的数据去做的,但有时候会不幸碰到样品测序失败不能用,导致每组就给你剩一个重复时候该怎么办,之前我有批数据就是这样,但是办法总比困难多不能放过任何实验数据,搜了搜其实还是有一些方法可以去解决的,在这里介绍下我搜到的几种方法。

假如现在你手头有如下文件(test.txt),只有俩样品RPKM_A (对照) 和RPKM_B (处理), 值为标准化后的RPKM。

1a3114ea7662

图片.png

1. 根据foldchange直接筛选

之前在一篇中文文献中见到有人用这种方法,作者自定义差异基因的标准:至少有一组RPKM值大于5,且满足foldchange(差异倍数) > 2,我们可以在LInux中直接可以用awk进行过滤,其实Excel、R中也可以操作,根据个人习惯吧。代码如下:

### 上调基因########

# 提取B组大于等于5,A组等于0的基因。

less test.txt | gawk '{if (($2==0)&&($3>=5)) print $0}' > up.txt

# 提取A、B俩组至少有一组大于等于5,且B组值/A组值大于等于2

<
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值