![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
RNAseq
文章平均质量分 62
宁生信
网易云课堂讲师,生物信息学,基因数据分析和可视化,R原因,Python,C语言,Linux。
展开
-
GTF基因注释文件详解
GFF和GTF是两种最常用的数据库注释格式,在信息分析中建库时除了需要fasta文件一般还会需要这两种文件,提取需要的信息进行注释。Cufflinks/Tophat 软件需要 GTF文件作为基因注释文件。 GFF全称为general feature format,这种格式主要是用来注释基因组。GTF全称为gene transfer format,主要是用来对基因进行注释。目原创 2017-06-03 12:33:55 · 51030 阅读 · 3 评论 -
tophat常见错误
转录组tophat2序列比对时遇到Tophat Error : Couldn't build bowtie index with err = 1原创 2017-06-12 09:31:47 · 3805 阅读 · 0 评论 -
Ubuntu安装BWA和samtools
Ubuntu安装BWA和samtools时通常需要提前安装zlib.h而centos并不需要。 安装命令:apt-get install zlib1g-devBWA下载地址: https://sourceforge.net/projects/bio-bwa/files/解压:tar -xjvf bwa-0.7.15cd bwa-0.7.15less INSTALL原创 2017-06-11 18:30:51 · 8385 阅读 · 0 评论 -
bowtie和samtools在tophat中的使用
Bowtie介绍1 Bowtie和一般的比对工具不一样,他适用于短reads比对到大的基因组上,尽管它也支持小的参考序列像amplicons和长达1024的reads。Bowtie采用基因组索引和reads的数据集作为输入文件并输出比对的列表。Bowtie设计思路是,1)短序列在基因组上至少有一处最适匹配,2)大部分的短序列的质量是比较高,3)短序列在基因组上最适匹配的位置最好只有一处。这原创 2017-06-11 10:35:42 · 2973 阅读 · 0 评论 -
基因表达量计算与差异表达分析常见问题
问 1:在没有重复实验的情况下,用 RPKM 要怎么做检验呢?答:如果要用泊松分布做差异分析模型的话,必须要用 reads count 的。只有 RPKM值的话,可以用 RPKM 的公式反推 reads count 数,再做检验。问 2:Deseq 是怎么控制 reads 多重比对的?答:Deseq 只是一个差异分析的软件,多重比对的分配是在 Deseq 之前的。 Deseq 是输入的转载 2017-06-10 22:30:19 · 41241 阅读 · 4 评论 -
RNA-seq中的基因表达量计算和表达差异分析
差异分析的步骤:1)比对;2) read count计算;3) read count的归一化;4)差异表达分析; 背景知识:1)比对:普通比对: BWA,SOAP开大GAP比对:Tophat( Bowtie2);2) Read count(多重比对的问题):丢弃平均分配利用Unique region估计并重新分配表达量计算的本质原创 2017-06-10 22:23:08 · 71950 阅读 · 3 评论 -
samtools使用大全
samtools是一个用于操作sam和bam文件(通常是短序列比对工具如bwa,bowtie2,hisat2,tophat2等等产生的,具体格式可以在消息框输入“SAM”查看)的工具合集,包含有许多命令。以下是常用命令的介绍。1.Viewview命令的主要功能是:将sam文件与bam文件互换;然后对bam文件进行各种操作,比如数据的排序(sort)和提取(这些操作 是对bam文转载 2017-06-08 09:25:15 · 37444 阅读 · 1 评论 -
RNA-Seq数据去接头(Adapter)
1、adapter是一段短的序列已知的核酸链,用于链接序列未知的目标测序片段。2、barcode,也称为index,是一段很短的寡居核酸链,用于在多个样品混合测序时,标记不同的样品。3、insert是用于测序的目标片段,因为是包括在两个adapter之间,所以被称为“插入”片段。一个常见测序片段类似与adapter--barcode--insert--adapter。测序开原创 2017-06-04 09:12:17 · 16831 阅读 · 0 评论 -
SRA数据库的各种编号
S R A 数据库, 最初的命名为Short Read Archive,现已改为SequenceRead Archive。SRA 数据库的组织架构1,meta 数据是指与测序实验及其实验样品相关的数据, 如实验目的、 实验设计、 测序平台、 样本数据(物种, 菌株,个体表型等),在SRA数据库中,meta数据分如下层次来存储:(1)研究课题(study)。 在 SRA 数据库中原创 2017-06-03 18:26:19 · 7542 阅读 · 0 评论 -
tophat生成文件之BED文件格式
BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。 每行的数据格式要求一致。The first three required BED fields are:1.chrom - The name of the chromosome (e.g. chr3, chrY, chr2_random) or scaffold (e.原创 2017-06-12 10:56:20 · 3765 阅读 · 0 评论