WES
文章平均质量分 65
theomarker
生物信息
展开
-
GATK Germline Best Practice学习
数据是sporadic的慢病case-control的组合。想用GATK germline best practice的方法进行突变的分析。这里主要参考GATK Germline best practice的教程。1 这里用的是GATK3.7的版本,目前已经出到GATK3.8。最近4.0也发布了。 部分步骤后续补完。。。...原创 2018-01-20 21:01:41 · 6883 阅读 · 0 评论 -
临床测序(WES, WGS)分析流程(一)基本流程+过滤
从指控->比对->BAM处理->call突变->合并gvcf都可参考我之前的GATK Germline Best Practivce假设目前得到VCF test1.vcf(包含4个样本,其中一个为CJ-258)Task1 提取CJ-258特有的突变 :java -Xmx15g -jar GenomeAnalysisTK.jar -R ucsc.hg19.fasta ...原创 2018-09-27 20:58:45 · 8538 阅读 · 0 评论 -
PLINK/SEQ association test
PLINK/seq可以检测表型-表型之间的相关性,用permutation或者asymptotic statistics。可以基于单变异,基因,也可以基于gene sets。single variant association检测一个变异和疾病(dichotomous outcome)的相关性:pseq proj v-assoc --phenotype my.phenotype当对于...翻译 2018-09-21 12:09:55 · 1662 阅读 · 0 评论 -
PLINKSEQ教程1
PLINK/SEQ教程1学习PLINK/SEQ,基于一个toy VCF dataset。使用帮助:pseq helppseq help stats #pseq help {command}PSEQ 使用:pseq input-source command {--argument} #input-source指定VCF文件或者一个PLINK/Seq proje...翻译 2018-08-13 16:37:04 · 983 阅读 · 0 评论 -
VCFtools学习
下载VCFtools用来处理VCF文档。可以1,筛选特定突变 2,比较文件 3,总结突变 4,转化文件格式 5,验证并合并文件 6,取突变交集和差集Get basic file statisticsinput可以为VCF或BCF格式(--vcf --gvcf or --bcf)。vcftools --vcf cohort.intersect.vcforzcat...翻译 2018-06-18 14:47:58 · 9248 阅读 · 2 评论 -
WDL学习
最近想把GATK流程化,方便后续工作。看到WDL+Cromwell的方法还是比较方便的。而且后续GATK出来的best practice也是按照WDL写的。就相当于是学习了。这里记录3个用的可能比较多的例子,具体的可见官网。case2. 编写一个多步骤(multi-step)流程例子数据下载 这个任务是要分开从haplotypeCaller得到的SNP和indel。...翻译 2018-04-13 09:39:35 · 3004 阅读 · 0 评论 -
使用WDL执行GATK HaplotypeCaller教程
Introduction这里的workflow叫做helloHaplotypeCaller;包含一个单任务即是GATK’s HaplotypeCaller。这个task输入一个file inputBAM,输入一个file rawVCF。Workflow 在workflow里,我们会执行task并指定task的执行顺序。 workflow helloHaplotypeCaller ...原创 2018-03-22 10:33:46 · 2667 阅读 · 0 评论 -
GATK Cromwell +WDL学习
WDL (一个workflow description language)+ Cromwell(an execution engine that can run WDL scripts)是目前可以更好使用GATK的一套工具。这里学习wdl的快速入门教程。WDLBase structureTop-level components: workflow, task and call ...原创 2018-03-20 19:56:26 · 4875 阅读 · 0 评论 -
临床测序(WES, WGS)分析流程(二)新发突变
task1 从trios找新发突变该例子基于trio.vcf,含有3个样本(mom, dad, son)。java -Xmx5g -jar GenomeAnalysisTK.jar -R ucsc.hg19.fasta -T SelectVariants -V trio.vcf -sn son -env -o son.vcfjava -Xmx5g -jar GenomeAnalysis...原创 2018-10-10 16:38:09 · 4335 阅读 · 5 评论