- 博客(6)
- 收藏
- 关注
原创 Bowtie2的简单使用笔记
Bowtie 2是一个超快的、内存效率高的工具,用于将测序读数与长参考序列进行比对。它特别擅长将大约50个到100个或1000个字符的读数进行比对,尤其擅长与相对较长的(如哺乳动物)基因组比对。Bowtie 2用FM索引对基因组进行索引,以保持其内存占用小:对于人类基因组,其内存占用通常约为3.2GB。Bowtie 2支持间隙式、局部式和成对端对齐模式。其中FM index就是就是一个BWT[T],一个checkpoint data,一个简化了的SA(具体参考。
2023-03-20 14:41:06 1548
原创 samtools的使用笔记
由于二代测序中普遍采取短读长(50~150bp)的测序策略,在后续分析的流程中需要使用比对软件将reads片段匹配到参考基因组中从而产生比对/匹配文件,进而用于后续流程的分析。Samtools是一个用来处理SAM/BAM(SAM的二进制格式,用于压缩空间)格式的比对文件的工具,它能够输入和输出SAM(sequence alignment/map:序列比对)格式的文件,对其进行排序、合并、建立索引等处理。
2023-03-20 14:11:13 985
原创 minimap2的简单安装使用流程
minimap2是一个通用的序列比对程序,可将DNA或mRNA序列与大型参考数据库进行比对。将 PacBio 或 Oxford Nanopore 基因组读数到人类基因组;寻找long reads之间的重叠,错误率高达~15%;PacBio Iso-Seq / Nanopore cDNA / Direct RNA reads与参考基因组的剪接感知比对(long reads);对齐Illumina的单端或成对端读取;Assembly与Assembly间比对;
2023-03-20 13:57:11 2902
原创 BWA的简单安装和使用
BWA,即Burrows-Wheeler-Alignment Tool。BWA 是一种能够将差异度较小的序列比对到一个较大的参考基因组上的软件包。功能:短系列比对,将测序得到的短片段在回帖到基因组上,这个过程也被称为mapping。mapping的结果包含了所有的信息,后续所有的分析都是基于这个mapping的结果。如果想分析二代测序的数据,就必须进行短序列比对。它由三种算法BWA-backtrack:比对 Illumina (二代测序)的序列,reads长度最长100bp。
2023-03-20 11:16:47 1773 1
原创 HMMER安装使用的简单流程
HMMER提供了一类被称为profile hidden Markov models的工具,这些工具被用于制作蛋白质和DNA序列域家族概率模型,并且可以用这些工具注释新的序列。不同于Blast的是:HMMER使用集成算法(ensemble algorithm),而Blast使用optimal alignment。HMMER可用于进行灵敏的同源搜索、蛋白结构域的自动注释、深度多重比较数据集的管理等等,并且适用于多个对比和单序列对比。
2023-03-16 14:34:58 2356
原创 Blast+安装使用的简单流程
通过https://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/网站下载,并执行安装为了使用BLAST的数据库,需要建立一个文件夹储存它们。
2023-03-16 00:13:19 1342 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人