The GEMINI database 表头详解

The GEMINI database schema The variants table Core VCF fields column_name type notes chrom STRING The chromosome on which the varia...

2017-12-29 10:04:33

阅读数 350

评论数 0

Calling SNPs/INDELs with SAMtools/BCFtools

Calling SNPs/INDELs with SAMtools/BCFtools The basic Command line Suppose we have reference sequences in ref.fa, indexed by samtools faidx, and...

2017-12-25 11:37:48

阅读数 741

评论数 0

使用aspera下载.fastq.gz和.sra数据

NCBI-SRA和EBI-ENA数据库 SRA数据库: Sequence Read Archive:隶属NCBI (National Center for Biotechnology Information),它是一个保存高通量测序原始数据以及比对信息和元数据 (metadata) 的数...

2017-12-25 11:12:07

阅读数 5638

评论数 3

bowtie2+Samtools+GATK使用方法简介

1) Phase I: Raw data processing (对于mapping结果的处理)   (1)   通过mapping得到原始的mapping结果 GATK要求输入文件是BAM格式的,我们使用bowtie2进行mapping,bowtie2速度上比较...

2017-12-22 08:47:06

阅读数 642

评论数 0

pyvcf 模块

安装: sudo pip install pyvcf 然后报错说没有counter模块,于是: sudo pip install counter 然后就安装好了   简单实用: import vcf  myvcf = vcf.Reader(open('t...

2017-12-20 14:29:25

阅读数 478

评论数 0

RPKM与TPM值的区别

对于RNA-Seq,目前主流还是用RPKM/FPKM来形容一个基因的表达量。有人说TPM更好。 RPKM定义:有一个基因A,它在这个样本的转录组数据中被测序而且mapping到基因组了 5000个的reads,而这个基因A长度是10K,我们总测序文库是50M,所以这个基因A的RPKM值是 5...

2017-12-13 13:39:02

阅读数 5500

评论数 0

仅对特定的基因call variation

对特定的基因call variation 有这个需求,是因为我们经常对某些细胞系进行有针对性的设计变异,比如BAF155的R1064K呀,H3F3A的K27呀,那我我们拿到高通量测序数据的时候,就肯定希望可以快速的看看这个基因是否被突变成功了。现在比对几乎不耗费什么时间了,但是得到的sam要...

2017-12-13 13:17:28

阅读数 304

评论数 0

ANNOVAR 注释软件

ANNOVAR简介 ANNOVAR是由王凯编写的一个注释软件,可以对SNP和indel进行注释,也可以进行变异的过滤筛选。 ANNOVAR能够利用最新的数据来分析各种基因组中的遗传变异。主要包含三种不同的注释方法,Gene-based Annotation(基于基因的注释)、Regio...

2017-12-13 13:03:49

阅读数 7968

评论数 0

非[无]root权限 服务器 下安装perl以及perl模块

非root安装perl及其包

2017-12-13 12:59:35

阅读数 471

评论数 0

samtools 常用命令详解

samtools 常用命令详解

2017-12-08 09:58:03

阅读数 611

评论数 0

二代测序call indel 总结

二代测序call indel 总结

2017-12-06 14:45:08

阅读数 2489

评论数 0

WGS,WES,RNA-seq组与ChIP-seq之间的异同

WGS,WES,RNA-seq组与ChIP-seq之间的异同

2017-12-06 14:00:10

阅读数 757

评论数 0

NGS基础名词解释(1)

NGS基础名词解释

2017-12-06 13:44:21

阅读数 2085

评论数 0

TCGA数据文件下载

TCGA数据文件下载 maf格式的mutation记录文件在TCGA里面已经是level4的数据啦,所以是完全open的,可以随意下载,只需要去其GDC官网简单点击,选择即可。 主要步骤就是在https://portal.gdc.cancer.gov/legacy-archive/search...

2017-12-04 16:57:37

阅读数 4196

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭