一个优秀的生物信息学家需要拥有很好的交叉思维,特别是数学和计算机基础,而不仅仅是生物背景知识。目前市面上有很多奇奇怪怪的培训课程,企图通过一两天的快速软件流程培训,就教会大家做生信。就像刘小乐老师写的生信的Level一样(http://www.longwoodgenomics.org/2014/10/11/levels-of-bioinformatics-research/) ,菜鸟级别和大牛级别差别很多。
只会使用工具的人,并不能称作生信,是搬运工;会使用生信工具解决生物学问题的人员,我认为他们应该仍然是生物学家,因为他们背后的依托,仍然是生物性质的。能够造生信工具(计算机能力)并且拥有良好数理背景(数学与统计能力),且生物学基础知识牢固可以指导好的生物学问题解决方案的人员,我认为才是一名Best Bioinformatics Scientist
就我而言,生信学家(机器学习与工具开发方向)需要掌握的数学基础有但不限于:
- 多元统计分析
- 回归分析
- 高等数理统计
- 随机过程
- 高等代数
- 矩阵分析 or 矩阵论
- 数学分析
- 能学点实变函数是最好
- 优化理论(包括但不限于凸优化)
- other
自己未来想做AI+基因组大数据
所以,我目前学习的数学清单如下,由于时间限制和个人精力分配,现在学习内容有限,之后会持续补充:
- 矩阵分析
- 高等数理统计
- 算法优化理论与应用