GATK
2tong杂货铺
哈尔滨工业大学 计算机科学与技术 硕士
展开
-
GATK4环境配置步骤札记
-->Requirements1:Java 8查看已安装的java环境后,如需安装java 8,可以按照如下方式进行操作:2:Optional,but recommended:------>Gradle添加PPA仓库、更新源后,可以查看可以安装的Gradle版本,选择其中一个版本安装即可,需要注意的是,Gradle3.1及以上需要Java 7及以上的支持:----->Python...原创 2018-07-11 14:23:15 · 4892 阅读 · 0 评论 -
cromwell--学习札记
前言:使用cromwell有一阵子了,但是一直对它不够了解,最近有时间开始整理了解到的一些内容。版本更新:目前使用的是版本31,最新的版本是34,当然过一阵子可能就会有更新的版本推出了,还是要持续关注小猪猪的~31.1Bug fix for $HOME variable in job script, performance improvements for metrics....原创 2018-08-22 14:27:23 · 1592 阅读 · 0 评论 -
Genome Browser使用方式札记
应该会持续更新,因为目前还搞不懂这些文件的作用,捂脸安装步骤介绍:-->1:安装dockersudo apt-get updatesudo apt-get install docker.iodocker --version-->2:获取NGB.gitgit clone https://github.com/epam/NGB.git-->3:进行构建cd NGB./grad...原创 2018-07-11 14:24:43 · 4317 阅读 · 0 评论 -
GATK环境配置步骤札记3---Ubuntu16.04安装和使用R、RStudio
从开始听GATK的培训会,就想要自己配置一个和GATK-Tutorial阿里云公共镜像一模一样的虚拟机环境。然而,现实是旅馆的网速很不给力,回来之后沉迷于迫切需要完成的、令我头大的工作,也没有足够多的时间来完成这件事情。嗯,其实还是自己有些懒了,嘿嘿,就很蠢,其实配置一下,对很迫切需要完成的工作还是有一定的好处的。基础环境:还是那个镜像,Ubuntu16.04-->1:安装Rsudo apt...原创 2018-07-10 14:28:26 · 2672 阅读 · 2 评论 -
GATK官方文档翻译--Spark
原文所在链接:SparkSpark简而言之,Spark是GATK4用来实现多线程的一种软件,是一种允许一台计算机(或计算机集群)尽快完成任务的并行化形式。你可以在这里阅读有关GATK中多线程、并行性的更多信息。Spark软件库是开源的,由Apache Software Foundation维护。在计算机行业中,Spark应用非常广泛,是加速分析流程执行速度的最有前景的技术之一。不是所有的GATK工...翻译 2018-07-11 14:23:08 · 2708 阅读 · 0 评论 -
GATK学习杂记
-->关于要不要使用samtools来进行格式转换在https://github.com/gatk-workflows/seq-format-conversion中指出,希望使用seq-format-conversion来代替使用samtools进行格式转换。理由有如下两点:1.Samtools1.3由于在包中含有老版本的htslib,导致会生成不正确的bins2.Samtools1.4和1...原创 2018-07-11 14:24:21 · 732 阅读 · 0 评论 -
GATK官方文档翻译--Tool Documentation Index
原文所在链接:Tool Documentation Index工具文档索引1.Copy Number Variant Discovery 拷贝数变异发现 2.Coverage Analysis 覆盖率分析3.Diagnostics and Quality Control 诊断和质量控制4.Intervals Manipulation 间隔操作5.Metagenomics 宏基因组学6.Other ...翻译 2018-07-10 13:10:24 · 1022 阅读 · 0 评论 -
GATK官方文档翻译-Data pre-processing for variant discovery
原文所在链接:Data pre-processing for variant discovery针对变异发现的数据预处理1.目的 为进行变异发现而进行的数据预处理,是强制性的第一阶段,必须先于所有变异发现。需要对以FASTQ或uBAM格式提供的原始序列化数据进行预处理,以生成可用于分析的BAM文件。涉及到对照参考基因组操作、一些数据清洗操作,来纠正技术偏差、使得数据更适于分析。 ...翻译 2018-07-11 14:24:09 · 514 阅读 · 0 评论 -
GATK4环境配置步骤札记2
很愚蠢的一点,输入wget之后,就放假回家去了,导致今天上班的时候才发现下载到20%的时候失败了........浏览器下载失败,转用wget URL的形式失败,改为采用:下载完成后,进行如下操作:而后,unzip gatk-4.0.2.1.zip文件,cd gatk-4.0.2.1后,ls下:--->新的环境需求,嗯,对的,目标是先local配置下gatk,然后运行下样例文件,所以,继续配置...原创 2018-07-11 14:23:25 · 4369 阅读 · 0 评论 -
GATK相关的术语整理
刚刚接触GATK有很多不了解的术语,这里做一下笔记,方便之后的继续学习:1:GATK全称为:Genome Analysis Toolkit;官网链接为: https://software.broadinstitute.org/gatk/;它是一个应用于前沿科学研究的软件,在不断地进行更新和修正,目前的版本是4.0,在使用时,最好登录官网,查看可供下载的最新版本,采用最新版本来进行相关研究;GATK...原创 2018-07-11 14:24:15 · 1424 阅读 · 0 评论