想涉猎生物信息学已经很久了,只是苦于平时作业繁重,没有连续的时间坐下来好好学习。好不容易捱到暑假,是时候补一波知识了。
自学教材:《生物信息学》(樊龙江主编)
当初在图书馆找教材,找了好几种,出版社不同,年代不同,装帧风格也非常不一样。迷茫的我就去请教了研究生师姐,然鹅她说课本这种东西都是大同小异的,于是我果断选了颜值最高同时也是出版最新的一本书 (2015 应该算是很新的了)。现在想想,可能还有一个因素是因为这是浙大的老师写的,虽然因为自己水平菜没去成,但所谓 “虽不能至,心向往之”,或多或少还是有一丝执念吧。
课本的第一部分就是对这门学科的介绍,写得很清晰,看起来也颇有意思,浓缩一下,大概就是这么几句话:
- 分子生物学研究的飞跃带来了生物信息的剧烈膨胀,并形成了巨量的生物信息库,促成了生物信息学这一全新研究领域的诞生。
- 生信的研究对象即生物信息包含有多种类型,如分子序列数据、蛋白质二级结构和三维结构。它们直接构成了初级数据库。而根据这些数据建立起来的功能区、二级结构、疏水位点等等,构成了所谓的二级数据库。
- 生信的主要内容可以概括为:新算法和统计学方法研究 + 各类数据的分析和解释 + 研制有效利用和管理数据的新工具。
- 生信的具体研究领域有:序列联配、基因预测、基因组拼接、药物设计和筛选、蛋白质结构预测、基因表达和蛋白质互作预测、全基因组连锁和进化分析等。
- 生信研究的基本思路是和生物学的基本思路一脉相承的,即先提出假设,再去检验假设是否正确,大概和统计学里面的假设检验有异曲同工之妙。
权威期刊:《Bioinformatics》
第二部分,则着重阐述了一个合格的生物信息学家所应该具备的基本技能:
- 具备分子生物学的核心知识。
- 了解中心法则。
- 掌握 1~2 个用于序列分析或模型的主要分子生物学网站。
- 熟练计算机命令行。
会使用 C/C++/PERL/Python
我现在可能只在编程语言和命令行方面有些许基础,其他方面还是两眼一抹黑。即使是编程语言,我也不敢说自己 “会了” 或是“懂了”,毕竟只是会了一些最基本的操作,要达到理解精髓,还有很长的一段路要走。
当前发展方向:
- 大基因组组装算法。
- 大基因组注释。
- 比较基因组与进化分析。
- 大基因组重测序数据分析核心技术。
- RNA 分析技术。