![](https://img-blog.csdnimg.cn/20200120212036283.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
转录组
转录组
Keiji1102
这个作者很懒,什么都没留下…
展开
-
转录组:STAR-Fusion融合基因
融合基因介绍概念在RNA水平上,由多个转录本构成的转录本。在DNA水平上,由两个或多个基因共同组成的新基因。NGS如何鉴定融合基因spanning readsR1和R2没有覆盖到连接点,只是比对的位置位于两个不同的基因上。潜在的融合基因,解释性较弱。split readsR1或R2的一条read位于连接点的两侧,有一条read直接覆盖到连接点上。解释性较强。...原创 2020-01-09 14:39:46 · 5056 阅读 · 1 评论 -
GATK:RNA-Seq
比对工具:STAR与TopHat相比,STAR灵敏度更高。使用STAR的two-pass mode比对可以使新型切割片段获得更好的比对结果。第一次建立参考基因组STAR --runMode genomeGenerate --runThreadN 8 --genomeDir ./star_index/ --genomeFastaFiles ./genome/chrX.fa ...原创 2020-01-07 15:21:05 · 2998 阅读 · 1 评论 -
limma:RNA-Seq Data
生成计数矩阵标准化和过滤第一步先创建DGEList对象。dge = DGEList(counts = counts)移除0和低计数值得行。keep = filterByExpr(dge,design)dge = dge[keep,,keep.lib.sizes = FALSE]标准化。dge = calcNormFactors(dge)差异表达:limma-trend...原创 2020-01-06 12:41:51 · 1279 阅读 · 0 评论 -
单端测序(Single-read)和双端测序(Paired-end和Mate-pair)
单端测序(Single-read)一.流程(1)将DNA样品片段化处理形成200-500bp片段(2)引物序列连接到DNA片段一端,然后末端加上接头。(3)将片段固定在flowcell上生成DNA蔟,上机测序单端读取序列。双端测序(Paired-end和Mate-pair)二.与Paired-end的区别Paired-end方法是指在构建待测DNA文库时在两端的接头上都加上测序引物...原创 2019-05-03 16:42:04 · 9376 阅读 · 0 评论 -
FASTA 与 FASTQ格式详解
FASTA1.FASTA存储什么?fasta存储核酸序列(DNA/RNA),也存储蛋白质的核苷酸序列(Animo Acid sequence,简称AA序列)2.FASTA包含什么内容?第一行:以“>”开头主要存储的是序列的描述信息第二行:序列3.例子1:AA序列(核苷酸序列)UniRef数据库中下载的人类血红蛋白α亚基的序列。>sp|P69905...原创 2019-05-03 16:42:27 · 5280 阅读 · 1 评论 -
SAM和BAM格式详解
SAM1.什么是SAM格式?SAM格式用于存储基于参考序列的比对序列,SAM(Sequence Alignment Map)是序列比对映射的首字母缩写。说明SAM是带有比对信息的序列文件(告诉你reads在染色体中的位置)。2.SAM包含什么内容?(1)标头注释部分(header section)header每一行以@开头。@RG开头是Read group信息这是在...原创 2019-12-14 22:14:25 · 2123 阅读 · 0 评论 -
GTF/GFF文件格式解读和转换
GFF文件全程为gerneral feature format,这种格式主要用来注释基因组。从Ensembel 导出的GFF文件实例,一共有9列,中间用tab键分开。**1.seq_id:**序列编号,一般为chr或者scanfold编号;**2.source:**注释的来源,一般为数据库或者注释机构,“.”表示未知;**3.type:**注释信息的类型,比如Gene、cDNA、mRN...原创 2019-12-14 22:14:50 · 4068 阅读 · 0 评论 -
DESeq2:检测差异表达基因
DESeq2的适用性分析来自RNA-seq的计数数据,基因任务是检测差异表达基因。也适用于其他分析:ChIP-Seq、HiC、shRNA筛选。快速开始dds = DESeqDataFromMatrix(countData = cts, colData = colData, design = ~batch + condition)dds = DESeq(d...原创 2020-01-05 18:43:25 · 12622 阅读 · 0 评论 -
edgeR:差异表达分析
edgeR的适用性适用于RNA-Seq,SAGE-Seq,Chip-Seq,CRISPR-Cas9,DNA methylation研究。快速入门glm approach 相比经典方法更灵活。旗下包含quasi-likelihood F-test method 和 likelihood ratio。quasi-likelihood: 建议用于大量RNA-seq数据的差异表达分析。like...原创 2020-01-05 18:41:19 · 14061 阅读 · 0 评论