【毕设所需环境,任务,以及资源,概念规整】
-----------------环境(IDE)------------------------
【Eclipse + Maven + Git + Cytoscape】Eclipse :code tool
Maven:project management
Git: version control
Cytoscape:API
------------------任务------------------------------
【实现聚类分析(Cluster Analysis)】
FAG-EC、HC-PIN、K-means、Dpclus、Monet、IPC-MCE
【评估方法】
Basic Information、
C-Score (P-vlaue/recall/Precision/f-measure)
Comparison with known complexes / Sensitivity,Specificity
----------------------资源--------------------------------
【基因注释(Gene Annotation)】
GO(Process / Function / Componment)
MIPS--protein数据库
---------------------Concepts-------------------------
GO:Gene Ontology[基因本体论]
GO structure:DAG (Directed Acyclic Graph)
file format:*.obo(OBO format)/*.xml (XML format)
GO relationship : is a / part of / regulates
GO 有一个数据库
PPI (Protein-Protein Interaction 蛋白质相互作用)
SCM(Source Control Management)
GO由三个相对独立的本体组成,包括
【生物过程(biological process, BP)】
【分子功能(molecular function, MF)】
【细胞成分(cellular component, CC)】
三个本体完整描述了基因产物的生物特征。GO的结构是一个有向无环图(directed acyclic graph, DAG),类似于树状图,GO短语的语义作为图中的节点,语义之间的关系作为图中的边。GO语义有两种相互关系,分别是is_a关系和part_of关系。GO数据库使用受控词和严格定义的概念关系,每一条GO短语可以看成是一条功能注释信息,每条功能注释都是对其祖先节点功能注释的进一步细化,注释到子孙节点的基因或蛋白质也必须具有其祖先节点的功能注释。
【DIP】Database of Interacting Proteins
用于蛋白质网络拓扑分析的蛋白质相互作用数据