HISAT2+STRINGTIE+BALLGOWN 分析转录组数据

最新推荐文章于 2024-04-17 21:17:24 发布

努力加can饭

最新推荐文章于 2024-04-17 21:17:24 发布

阅读量1.8w

点赞数 8

分类专栏： R学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41933915/article/details/81873596

版权

师兄推荐这篇文章，按照里面的命令，先做一套转录组分析。

参考文献：

Pertea M, Kim D,Pertea G M, et al. Transcript-level expression analysis of RNA-seq experimentswith HISAT, StringTie and Ballgown.[J]. Nature Protocols, 2016, 11(9):1650.

全文链接：http://www.ccb.jhu.edu/people/infphilo/data/nprot.2016.095.pdf

我是借鉴的简书上的一篇博文，https://www.jianshu.com/p/38c2406367d5，谢谢这个博主啦！

数据：https://pan.baidu.com/s/1aX93Q65Dit3iqslRWkQcsw

genes 针对基因组的注释文件.gtf

genome 染色体X的序列文件 chrX.fa

geuvadis_phenodata.csv

mergelist.txt 以上两个都是之前博主创建表明数据关系的文件

indexes hisat2对于染色体X的indexes文件，1~8.ht2 索引文件

samples 数据 fastq.gz

文章背景：见文章

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

转录组分析背景知识：

从原始RNA-Seq数据着手，质控——建立索引文件——比对、拼接、排序——初组装——合并——计算表达量，并输出为baoogown格式——进行差异分析——作图，这里输出结果包括基因list、转录本，及每个样本的表达量，能表现差异表达基因的表格并完成显著性计算。

在R里使用ballgown处理需要得到： #了解一下就OK

1. 表型数据关于样本的信息

2. 表达数据标准化和未标准化的关于外显子，junction，转录本，基因的表达数量

3. 基因信息有关外显子，junction，转录本，基因的坐标以及注释信息

大多数差异表达分析都会包括一下几个步骤： #需要着重理解

1. 数据可视化和检查

2. 差异表达的统计分析

3. 多重检验校正

4. 下游检查和数据summary

ballgown的使用： #分析过程的难点在ballgown，提前理解有助于后面，现在回过头来看还是很懵逼……

1. 数据的读入

2. 预测丰度的检查：以FPKM为单位的丰度预测将会根据library size进行标准化。FPKM（fragments per kilobase of transcript per million mapped reads）

3. 使用线性模型进行差异表达分析，由于FPKM对于转录本解读过于曲解，所以这里需要使用log转化处理数据，随后再使用线性模型进行差异分析。

4. ballgown可以对于time-course和fixed_conduction数据进行差异分析，但是无法避免批次效应带来的误差。# 使用stattest功能可以指定任何已知的confounder

5. ballgown 可以帮助你在基因、转录本、外显子、junction水平上进行差异分析。

6. 结果会以表格形式展出，如果样本多还有p值和q值。

7.

最低0.47元/天解锁文章

努力加can饭

关注

8
点赞
踩
50

收藏

觉得还不错? 一键收藏
10
评论
HISAT2+STRINGTIE+BALLGOWN 分析转录组数据

师兄推荐这篇文章，按照里面的命令，先做一套转录组分析。参考文献：Pertea M, Kim D,Pertea G M, et al. Transcript-level expression analysis of RNA-seq experimentswith HISAT, StringTie and Ballgown.[J]. Nature Protocols, 2016, 11(9):...
复制链接

扫一扫

专栏目录

努力加can饭 CSDN认证博客专家 CSDN认证企业博客

码龄6年

4: 原创

53万+: 周排名

157万+: 总排名

4万+: 访问

: 等级

327: 积分

23: 粉丝

21: 获赞

13: 评论

122: 收藏

私信

关注

热门文章

分类专栏

R学习 2篇
生信 3篇

最新评论

HISAT2+STRINGTIE+BALLGOWN 分析转录组数据
努力加can饭: 是的
HISAT2+STRINGTIE+BALLGOWN 分析转录组数据
weixin_52404228: [code=python] for i in *1.fastq; do i=${i%1.fastq*}; hisat2 -p 8-x /home/czou/lixin/b/chrX_data/indexes/chrX_tran -1 ${i}1.fastq -2 ${i}2.fastq -S ${i}.sam done [/code] 请问这个代码中的1.fastq是保存clean序列的文件夹名称吗
学习大神使用R画火山图详细步骤
CCNoT: significant设置是怎么设置呀？通过计算阈值设定不同分组吗？
HISAT2+STRINGTIE+BALLGOWN 分析转录组数据
努力加can饭: 是的，不做，你没办法得到合并的转录本，后续也没法做
HISAT2+STRINGTIE+BALLGOWN 分析转录组数据
聆风的桂花颗粒: 请问你解决了吗？我也遇到这个困难了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。