1.生物学背景知识
生物信息就是利用统计知识和处理软件对生物标记数据进行分析,研究其具体的意义肯定要了解生物学背景的。
2.生信分析类软件使用
大多数人都是使用别人开发好的生信软件处理数据,软件怎么使用就是最基础的能力了;另外就是生物信息分析的软件开发,这个要求对于大多数人来说就很困难了。
3.统计学基础知识
在分析具体数据的时候,我们需要选择合适的分析方法对数据进行统计分析,概率论和数理统计知识是必不可少的。
4.linux操作
常用的命令比如ls,mkdir等等一天就可以掌握,高级一点的命令比如awk,find等需要一定的熟练度;另外生信分析过程中需要在linux系统上安装软件,conda就是一个比较好的工具;
现在的大公司为了流程维护移植的方便,越来越倾向于使用docker 和singularity 镜像等搭建分析流程;
5.数据处理能力
脚本语言比如perl/python,数据统计分析软件比如R/python/Jamovi等
6.数据库
生信需要处理庞大的数据,也有庞大的数据库,要提高效率就要借助数据库,比如查询某个位点的在各个数据中的突变信息不可能存个哈希再查找吧。
7.英文读写
文献资料查阅,撰写文章,和客户沟通交流
8.machine learning
classification,regression,clustering,dimensionality reduction,model selection