![368d23530e7f9bbca9b0cb0ff3be1555.png](https://i-blog.csdnimg.cn/blog_migrate/aa14881838f0e143cb7e7b1c386cc9d1.jpeg)
以下整理是我个人几年来学习bioinformatics发现的“宝藏”生信学习资料,如果你对生信抱有强烈的兴趣,建议你没事的时候多刷一刷这些网站,系统性地培养生信的学科思维。
生信作为一门日新月异的学科,技术及指导思想更迭迅速;交叉学科的性质又使得入门生信变得困难。不管你是去买课还是看中文教程,精进生信的必经之路肯定少不了去看原始英文文档;除此之外,有许多优秀的网站为生信知识的传播做足了功夫,其质量之精美远远超过大部分中文互联网上的教程,而且难度编排十分友好,适合入门或进阶。
再次感谢这些前辈们的开源精神。
本文一共分为三大类:Tutorial(基础知识),Project(实战项目),tools(代码、算法、工具讲解)
一、Tutorial
- Galaxy Training:
![006cf164287274ed3965206ce41c6a37.png](https://i-blog.csdnimg.cn/blog_migrate/a7fd527384fa84f67002e0b261e2d1cc.jpeg)
![9ea6fc67b982ac14a35c13cf7cbded96.png](https://i-blog.csdnimg.cn/blog_migrate/48cbdf0b5c4728da3951eb119a4d955a.jpeg)
比如进入"transcriptomics"-"understanding barcodes"
![3d3c849f7eb7da2ae8789e34e479c8c7.png](https://i-blog.csdnimg.cn/blog_migrate/bcaf088ba0cccf13e7e7211e3d53aeff.jpeg)
2. 清华大学鲁志老师实验室学习资料:
Bioinformatics Tutorialslulab.gitbook.io![054638b2ae8abf064ddba17bbc478958.png](https://i-blog.csdnimg.cn/blog_migrate/18e0736e31eda36778108dcb65c639d3.jpeg)
鲁志老师是清华大学生命科学学院教授,我曾在夏令营和他交流过,为人和蔼,学术水平高,非常关心学生的发展。
鲁志:博士生导师,教育部“新世纪人才计划”获得者;(详情见清华大学生命科学学院官网)
该tutorial基本涵盖了生信的大部分话题,非常适合小白系统入门,也可以作为工具书,随查随用。除了基础的NGS分析,该教程还提供了详实的关于Machine learning入门的学习资料,以及关于Machine learning应用到生物信息分析中的案例。
![bfe495634fb92f5607978dfb83dbfee5.png](https://i-blog.csdnimg.cn/blog_migrate/479a46b04b35af084d4d3b86e0d722de.jpeg)
除了基础知识,鲁老师的教程还提供了数据,下载docker(教程开头有对应的指导)相关的Image,启用docker便可以自己实操分析数据。
![ecc75d440600d1803b42607843194e3e.png](https://i-blog.csdnimg.cn/blog_migrate/70e6c77025f95b55962229eaa8ff5903.jpeg)
3. Genomicsclass: 十分综合的一个教程,涵盖线性代数等数学基础、机器学习、常见组学分析数据处理(如batch effect)以及统计检验理论等到,适合作为工具书。
PH525x series - Biomedical Data Sciencegenomicsclass.github.io![98fb0df885f69d82d60b7ccbe9b57190.png](https://i-blog.csdnimg.cn/blog_migrate/9eb5dd3f3cb458aad4b998df220e1ae2.jpeg)
![0ffe7b4ed2f7e08f0d2deefeeed80290.png](https://i-blog.csdnimg.cn/blog_migrate/16e0868aef671072dda4f44a04bb9e67.jpeg)
二、 Project
1. Bioconductor: 做生信怎么可能少得了大名鼎鼎的bioconductor, 里面的教程质量也是杠杠的,大多是围绕一个话题讲解一个包的使用。可以以项目为基础学习很多优秀的包处理技巧。
Bioconductor - Courses and Conferencesbioconductor.org比如,搜索"RNA-seq",点击
https://bioconductor.github.io/BiocWorkshops/analysis-of-single-cell-rna-seq-data-dimensionality-reduction-clustering-and-lineage-inference.htmlbioconductor.github.ioThe Bioconductor 2018 Workshop Compilation
https://bioconductor.github.io/BiocWorkshops/analysis-of-single-cell-rna-seq-data-dimensionality-reduction-clustering-and-lineage-inference.htmlbioconductor.github.io![b902a57e1de1c28abde3c3f79894a509.png](https://i-blog.csdnimg.cn/blog_migrate/1308e6e4dc005cbd523bacf29b0af235.jpeg)
2. 接下来是几个著名的机构:Sanger Institute & Broad Institute
https://scrnaseq-course.cog.sanger.ac.uk/website/index.htmlscrnaseq-course.cog.sanger.ac.uk https://broadinstitute.github.io/2019_scWorkshop/index.htmlbroadinstitute.github.io![8464abaeea2b306989e8c5663e788dfc.png](https://i-blog.csdnimg.cn/blog_migrate/53688357115da251fe82fbb1ef0e7dec.jpeg)
如果你毫无项目经验,强烈建议你在掌握一定生信基础后,按照以上几个流程完整地跑一遍,在这个过程你会学会:如何配置环境,如何安装软件,如何根据文档学会软件的使用,下载数据,分析数据,如何验证分析的结论,如何把计算结果可视化等等。只有完整地分析下来,才能真正算跨入了生信的大门。
3. 加拿大生物信息中心:
https://bioinformaticsdotca.github.io/bioinformaticsdotca.github.io从甲基化分析到转录组、宏基因组,再到网络分析等等,涵盖面比较广,不仅配套教程,还有相应的视频(youtube),缺点是数据难以直接下载。
![5f467f2837aeb21ff713442e0f542aa6.png](https://i-blog.csdnimg.cn/blog_migrate/e4abd145ef3a6c43aefbf972e8e48ece.jpeg)
三、tools
- JHU的Langmead-lab, 同时他也是bowtie2的作者
![96b54d4e844d80c6598392546b88bfda.png](https://i-blog.csdnimg.cn/blog_migrate/e449175a09677968b9bf38f3eba978f7.jpeg)
![91859a55138b430d18afc8ef26b39f43.png](https://i-blog.csdnimg.cn/blog_migrate/71d536be167ca2f4869057978bda6548.jpeg)
![b9a06a3be597925b89e63b5f70e3de4b.png](https://i-blog.csdnimg.cn/blog_migrate/2028c03ddfb1b4310f9a5380d6969735.jpeg)
如果你对比对、拼接算法感兴趣的话,可以看看这门课,写一个小的比对软件:
https://www.coursera.org/course/ads1www.coursera.org2. 哈佛FAS:
Harvard FAS Informaticsinformatics.fas.harvard.edu有许多软件的tutorial,如grep,baw, trinity 以及R的进阶操作
![0dec5610539ab85dd6663916367b2baf.png](https://i-blog.csdnimg.cn/blog_migrate/fb2c5ace61f57b66e21abd6dc460c09d.jpeg)
3. Rosalind,很著名的一个生信刷题网站;包括了许多生信基础操作,比如处理fasta文件等等
ROSALIND | Problems | Locationsrosalind.info4. 如果你想进阶R语言:
https://github.com/sienkie/R_for_data_science/blob/master/R_for_data_science.Rmdgithub.comtidyverse流处理,将大大提高效率,可以说是R数据科学的进阶的必经之路。
写在最后
本文将持续不断更新,欢迎大家一起共享优质资源,共同为开源社区出力~
生信资源不在于多而在于精,笔者本人也从未从头到尾看完过这些教程,不过是遇到问题了随时翻阅——每每回味,颇有益处.