生物信息学,是一门综合学科。涉及到数学,
生物学和计算机的内容。但在我看来,计算机的基础需要,
但要求不是很高,关键是要有很好的生物学知识,包括遗传学的、
生物化学的、发育生物学的、分子生物学的、
植物生理学的知识等等,也就说需要达到这样的一个要求:
在进行数据分析时,能对各种分析结果进行生物学的评价,
并给出最优的分析策略。同时也应该有纯熟的数理基础,
包括统计学的、拓扑学的,
这样才能把待分析的问题转换成可计算的模型,
最后能给出实现的程序。
从个人来说,因为生物信息学是一个非常大的领域,所以,
关键是要确定自己的研究方向。比如,
以关联分析为方向的生物信息学,
那么就要掌握好各种关联分析的统计分析方法,
有很强的数据管理能力,足够好的序列分析能力(
这是进行variation查找和分析的基础)。
回到6年以前,如果决定在生物信息学上发展,
那么我也许会做下面这些事情:
首先,从最不重要的计算机这个方面来说:
(1)要掌握好bash等脚本语言,
一般的linux问题都能很好的解决
(2)熟练使用apache,mysql等基础软件工具,
用joomla等CMS配置搭建网站
(3)应该努力精通perl,bioperl,
以基于此的各种分析工具,比如gbrowser,cmap等
(4)足够好的c/c++语言能力,
这是实现新算法的最高效语言。
(5)应该努力精通R语言,这是进行统计分析的基础工具
(6)如果有机会,学学erlang这样一些函数式语言吧
其次,从数学基础来说,我觉得应该:
(1)学好线性代数
(2)学好高等数学,或者数学分析
(3)学好统计学
(4)学好离散数学
(5)学好计算机算法和数据结构
其次,从生物学来说:
(1)如果没有进化论的基层,请把进化论学好
(2)学好发育生物学,植物生理学
(3)学好基因组学、遗传学等
千万不要认为这些没有什么用,当你在数据分析,
怎么判断结果的合理性,或者对结果进行解释时候,
都离不开这些生物学问题。最后,你对这些问题的理解成度,
决定了你的生物信息学水平:只是一个有生物学知识的、
会进行计算机操作的技术员,
还是一个能给出解决方案的有良好计算机基础的能把握生物学问题的
生物信息学家。
最后,从生物信息学的角度来说:
(1)对NCBI等各大数据库非常熟悉
(2)对各种生物学信息学的分析方法和策略非常的清楚,
至少应该知道有那些工具软件,
以及这些工具软件的原理和基于的生物学基础,包括:
基因组学分析,表达谱分析,代谢组分析、调控网络分析、
数据结果的整合展示等
最后,生物信息学是一个发展很快的学科,
但因起涉及的内容比较多,因此,要想到底一定的要求,
是需要付出巨大的努力的。此外,在进行生物信息学学习的过程中,
对自己感兴趣的方法工具,一定要把文献上的数据拿来,
自己独立分析一遍,自己去体会分析的过程,
从而对这些方法和工具有更深入的理解。