生物信息技术
vincentluo91
路漫漫其修远兮,吾将上下而求索~
展开
-
SAM/BAM格式文件操作软件samtools使用说明
SAM和BAM是序列比对之后常用的输出格式,比如tophat输出BAM格式,bowtie和bwa等都采用了SAM格式。BAM格式其实就是SAM格式的二进制格式,占用存储空间更小。samtools由中国学者开发,专门用于sam/bam格式文件的各种操作。1)查看BAM/SAM格式文件 $ samtools view [‐bhuHS] [‐t in.refList] [‐o ou转载 2017-03-21 11:59:05 · 9406 阅读 · 0 评论 -
VCF格式详解
1. 什么是VCF?VCF是用于描述SNP,INDEL和SV结果的文本文件。在GATK软件中得到最好的支持,当然SAMtools得到的结果也是VCF格式,和GATK的VCF格式有点差别。2. VCF的主体结构先给出一个VCF文件的范例:##fileformat=VCFv4.0 ##FILTER= ##FORMAT= ##FORMAT= ##FORMAT= ##FORMA转载 2017-05-23 15:38:09 · 10587 阅读 · 0 评论 -
使用Aspera从EBI或NCBI下载基因组数据
做基因组数据分析,可能经常从NCBI的GEO/SRA或者EBI的ENA数据库下载高通量的数据,动辄几十G的数据用wget下载实在太纠结,这时就要用到神器-Aspera了。使用Aspera,最简单的方法当然就是使用浏览器插件Aspera Connect了,跟迅雷、Flashget的用法差不多,直接单击Aspera支持的下载地址,就自动切换到Aspera的窗口开始下载了。当我们登录到自转载 2017-06-12 11:20:21 · 3890 阅读 · 0 评论