RNA-seq
文章平均质量分 75
TIME_@
Personal notebook
展开
-
RNAseq-GO、biomaRt转换ID
O.Sativa选用MSU或者RAPDB这两个数据库的genome和gtf文件,介绍一下MSU的ID,RAPDB的同理。The Rice Annotation Project (RAP)(https://rapdb.dna.affrc.go.jp/index.html)和Rice Genome Annotation Project (RGAP7,MSU)(http://rice.plantbiology.msu.edu/index.shtml)RAP格式为“Os-Chr-g-number”,MSU格式为“L原创 2021-11-18 17:21:03 · 4076 阅读 · 0 评论 -
RNA-seq:【FastQC】
常见问题项分析Per Base Sequence ContentATGC碱基在各个位置上的分布。统计read的每个位置ATCG分布,正常四条线平行且相近。当部分出现bias,提示有overrepresented sequence的。如前10个位置,每种碱基频率有略微的差别,说明可能有污染【开头碱基比例跳动原因?】。任一位置的A/T比例与G/C相差超过10%,报"WARN";超过20%,报"FAIL"。一般AT含量高于CG,AT约28%,CG约22%。Per Sequence GC Conten原创 2021-09-06 09:32:13 · 1091 阅读 · 0 评论 -
RNA-seq【分析记录】
视频学习笔记概述预处理FASTQC数据质控数据过滤Trimmomatic有参转录组序列比对不同比对软件的比较常用序列比对算法基因组比对STARhisat2转录本比对 RSEM无参转录组转录本从头拼接原理拼接方法 Trinity表达定量RNA-seq常用统计定量单位基因组比对Htseq-CountFeatureCount转录本比对 RSEM数据分析思路?差异表达+ Deseq标准化原理富集分析+ GO+ 通路富集分原创 2021-08-27 20:13:42 · 1860 阅读 · 0 评论 -
Bam文件去重复
RNA-seq一般不去重复ChIP-seq一般去重复call SNP一般去重复还需参考起始量和PCR扩增数判断是否去重复。reads mapping覆盖均匀度可以判断是否需要去重复。PCR去重工具首选Picard根源上解决去重复问题:起始量高,循环数少,reads能长不短,能双端不单端PCR重复的危害理论上不同序列在PCR扩增时,扩增的倍数应该相同。但是由于聚合酶的偏好性,PCR扩增次数过多的情况下,会导致一些序列持续扩增,而另一些序列扩增到一定程度后便不再进行,也就是常说的PCR偏好原创 2021-09-04 21:00:33 · 1268 阅读 · 0 评论 -
RNA-seq中的生物学重复
生物学重复:经过相同方式处理相同样品(不是同一个体)。指样本重复,比如3只小鼠,同时做一种处理,就是三个生物学重复。消除组内误差:生物学重复可以测量变异程度。增强结果可靠性:测序的样本数越多,越能够降低背景差异。检测离群样本:异常样本的存在,会严重影响测序结果的准确性,通过计算样本间的相关性可以发现异常样本,将其排除。没有生物学重复实验发文章困难,如确实无法设置生物学重复。就得结合强有力的实验数据支撑,如定量实验,FISH荧光原位杂交,或是northern 杂交等,用实验数据说服。考虑到现实条件.原创 2021-09-04 20:59:10 · 2626 阅读 · 0 评论