基迪奥的GWAS系列课程已经上线3周了,上周收到一位学员(ID:可乐加冰啊)的学习心得。他学完GWAS系列课程后,用学到的技能完成了自己手里数据的分析。值得点赞的是,他把学习心得记录下来与大家分享,希望可以给学习GWAS的同学一个参考。以下是作者的原文(稍作修改):
随着测序技术的不断发展以及价格的不断降低,重测序越来越普及。下面给大家分享一下重测序数据的全基因组关联分析的分析流程。我将分几次给大家讲一下GWAS如何学习,表型处理,基因型处理,群体结构与亲缘关系计算,关联分析,结果筛选与展示。
首先,做分析需要各种软件。先给大家列举一下GWAS分析中所用的软件,vcftools(基因型文件过滤),bcftools(染色体文件合并等等),gcta(kinship计算),plink(vcf文件的格式转换以及过滤等),admixture(群体结构计算),tassel(用于GWAS分析),R(后续画图)。
那这些软件如何安装呢,当我还是个小白的时候(虽然我现在也白),我搜索admixture居然用的是360软件管家,emmm,现在想起来真是可怕! 为了避免大家多走弯路,今天以vcftools为例,给大家讲解如何安装GWAS所需要的软件。
首先 ,你需要掌握一些基本的Linux命令,比如cd pwdcp mkdir mv wget 你至少得会下载文件,建立目录吧。关于这方面的学习,建议看2本书,《Linux的鸟哥私房菜》和《Linux就该这么学》。这里不过多的给大家阐述Linux方面的知识。我只是想告诉大家,如果你想做重测序的GWAS分析,Linux是你必须掌握的,不要