区别探索:掩码语言模型 (MLM) 和因果语言模型 (CLM)的区别
基因本体论GO(Gene Ontology)
基因本体,即 Gene Ontology,是对所有基因的功能进行描述的本体数据库。该数据库将收录的基因本体按照术语描述的内容不同,将所有基因本体分为三大类,分别是描述分子功能的本体,描述细胞组分的本体以及描述生物过程的本体。
- 分子功能(Molecular Function):描述发生在分子水平上的活性,这种活性一般都是由单个基因产物进行的活性,比如“催化活性”、“结合活性”、“转运蛋白活性”等。当然,还有小部分活性是通过基因产物的复合物进行的活性,比如“腺苷酸环化酶活性”、“Toll 受体结合”等。
- 细胞组分(Cellular Component):描述某些大分子在执行某项分子功能时占据细胞的结构和位置。细胞的位置描述如“质膜的细胞质侧”,细胞的结构描述如“线粒体”,“核糖体”等。
- 生物过程(Biological Process):描述了由一个或多个有组织的分子功能集合共同完成的一系列事件。广泛的生物过程术语如“细胞生理过程”、“信号传导”等。具体的生物过程术语如“嘧啶代谢过程”、“α-葡萄糖苷转运”等。
以上三类术语按照对基因注释的关注点不同所产生的描述会有所区别,但都是对同一基因或者基因产物进行描述。例如,基因产物“细胞色素 c”可以通过分子功能术语描述为“氧化还原酶活性”,生物过程术语描述为“氧化磷酸化”和细胞组分术语描述为“线粒体基质”http://t.csdnimg.cn/lfpdq和“线粒体内膜”。