常用Hallmark及KEGG、GO基因查询

文献:The Molecular Signatures Database (MSigDB) hallmark gene set collection - PMC (nih.gov)

 GSEA | MSigDB | Browse Human Gene Sets (gsea-msigdb.org)通过msigdb数据库可以查看各个Hallmark、KEGG、GO具体包含的基因细节。

Hallmark nameProcess categoryDescriptionNumber of
founder sets
Number
of genes

1APICAL_JUNCTIONcellular componentApical junction complex consisting of adherens and tight junctions37200
2APICAL_SURFACEcellular componentMembrane proteins in the apical domain1244
3PEROXISOMEcellular componentPeroxisomes28107

4ADIPOGENESISdevelopmentAdipocyte development36200
5ANGIOGENESISdevelopmentBlood vessel formation1436
6EPITHELIAL_MESENCHYMAL_TRANSITIONdevelopmentEpithelial mesenchymal transition107200
7MYOGENESISdevelopmentMuscle differentiation64200
8SPERMATOGENESISdevelopmentSperm development and male fertility24135
9PANCREAS_BETA_CELLdevelopmentGenes specific to pancreatic beta cells2440

10DNA_REPAIRDNA damageDNA repair44150
11UV_RESPONSE_DOWNDNA damageUV response: down-regulated genes17144
12UV_RESPONSE_UPDNA damageUV response: up-regulated genes16158

13ALLOGRAFT_REJECTIONimmuneAllograft rejection190200
14COAGULATIONimmuneCoagulation cascade71138
15COMPLEMENTimmuneComplement cascade71200
16INTERFERON_ALPHA_RESPONSEimmuneInterferon alpha response8297
17INTERFERON_GAMMA_RESPONSEimmuneInterferon gamma response82200
18IL6_JAK_STAT3_SIGNALINGimmuneIL6 STAT3 signaling during acute phase response2487
19INFLAMMATORY_RESPONSEimmuneInflammation120200

20BILE_ACID_METABOLISMmetabolicBiosynthesis of bile acids28112
21CHOLESTEROL_HOMEOSTASISmetabolicCholesterol homeostasis2874
22FATTY_ACID_METABOLISMmetabolicFatty acid metabolism53158
23GLYCOLYSISmetabolicGlycolysis and gluconeogenesis87200
24HEME_METABOLISMmetabolicHeme metabolism36200
25OXIDATIVE_PHOSPHORYLATIONmetabolicOxidative phosphorylation and citric acid cycle93200
26XENOBIOTIC_METABOLISMmetabolicMetabolism of xenobiotics124200

27APOPTOSISpathwayProgrammed cell death; caspase pathway80161
28HYPOXIApathwayResponse to hypoxia; HIF1A targets87200
29PROTEIN_SECRETIONpathwayProtein secretion7496
30UNFOLDED_PROTEIN_RESPONSEpathwayUnfolded protein response; ER stress22113
31REACTIVE_OXYGEN_SPECIES_PATHWAYpathwayReactive oxygen species (ROS) pathway1349

32E2F_TARGETSproliferationE2F targets420200
33G2M_CHECKPOINTproliferationCell cycle G2/M checkpoint420200
34MYC_TARGETS_V1proliferationMYC targets variant 1404200
35MYC_TARGETS_V2proliferationMYC targets variant 2658
36P53_PATHWAYproliferationp53 pathway85200
37MITOTIC_SPINDLEproliferationMitotic spindle assembly108200

38ANDROGEN_RESPONSEsignalingAndrogen response8117
39ESTROGEN_RESPONSE_EARLYsignalingEarly estrogen response61200
40ESTROGEN_RESPONSE_LATEsignalingLate estrogen response61200
41IL2_JAK_STAT5_SIGNALINGsignalingIL2 STAT5 signaling13200
42KRAS_SIGNALING_UPsignalingKRAS signaling, up-regulated genes14200
43KRAS_SIGNALING_DOWNsignalingKRAS signaling, down-regulated genes16200
44MTORC1_SIGNALINGsignalingmTORC1 signaling487200
45NOTCH_SIGNALINGsignalingNotch signaling4932
46PI3K_AKT_MTOR_SIGNALINGsignalingPI3K signaling via AKT to mTORC1591105
47HEDGEHOG_SIGNALINGsignalingHedgehog signaling7936
48TGF_BETA_SIGNALINGsignalingTGF beta signaling2954
49TNFA_SIGNALING_VIA_NFKBsignalingTNFA signaling via NFkB132200
50WNT_BETA_CATENIN_SIGNALINGsignalingCannonical beta catenin pathway4942

例如查询EMT基因集:

REACTOME_TGF_BETA_RECEPTOR_SIGNALING_IN_EMT_EPITHELIAL_TO_MESENCHYMAL_TRANSITION (gsea-msigdb.org)

(需要先使用edu邮箱进行注册)

ARHGEF18
CGN
F11R
FKBP1A
PARD3
PARD6A
PRKCZ
RHOA
RPS27A
SMURF1
TGFB1
TGFBR1
TGFBR2
UBA52
UBB
UBC
参考文献:

1:The Molecular Signatures Database (MSigDB) hallmark gene set collection

<think>嗯,用户的问题是关于骨骼相关的单细胞测序中用于基因注释的基因集合。首先,我需要明确用户的具体需求。他们可能在单细胞测序数据分析中,需要识别或注释与骨骼相关的细胞类型或功能,因此需要特定的基因集合作为参考。 首先,我应该回顾常见的骨骼相关基因集合。骨生成和骨吸收相关的基因是关键,比如RUNX2、SP7(Osterix)、COL1A1等。这些是成骨细胞分化和骨基质形成的核心基因。此外,破骨细胞相关基因如CTSK、ACP5(TRAP)也应该包括在内。用户可能需要这些基因来区分不同的细胞类型,比如在单细胞数据中识别成骨细胞或破骨细胞。 接下来,软骨相关基因也是骨骼系统的一部分,如SOX9、COL2A1。这些基因在软骨细胞中高表达,可能帮助用户注释软骨相关的细胞群。此外,骨骼发育相关的信号通路,比如Wnt、BMP、Hedgehog通路,这些通路中的基因如WNT5A、BMP2、IHH可能也是重要的。 然后,考虑到单细胞测序的数据分析,用户可能需要使用已有的数据库或资源。比如MSigDB中的基因集,或者GO Term中的骨骼发育相关条目。另外,CellMarker数据库可能提供特定细胞类型的标记基因,这对注释单细胞数据中的细胞类型非常有帮助。 用户可能还需要知道如何应用这些基因集合,比如在Seurat分析中使用AddModuleScore进行功能评分,或者进行GSEA富集分析。这些方法可以帮助他们确定哪些基因集在特定细胞群中活跃。 另外,需要提醒用户注意数据预处理和验证。例如,单细胞数据的质量控制和批次效应可能会影响结果。同时,实验验证如免疫组化或qPCR可以确认生物学的相关性。 可能用户没有明确提到的需求包括:是否需要跨物种的基因集合?比如如果研究的是小鼠,基因名称可能需要转换。另外,是否需要考虑疾病状态下的骨骼相关基因,比如骨质疏松或关节炎中的差异表达基因? 总结,我需要系统地列出骨骼相关的主要基因,推荐可用的数据库,介绍分析方法,并给出注意事项,确保用户能够有效地应用这些基因集合到他们的单细胞数据分析中。</think>在骨骼相关的单细胞测序研究中,基因注释的基因集合主要聚焦于骨细胞分化、基质形成、矿化调控等生物学过程。以下是关键基因集合及资源: --- ### 一、核心骨骼相关基因集合 1. **成骨细胞分化标志物** - $RUNX2$(成骨细胞分化的主调控因子) - $SP7$(Osterix,调控成骨细胞成熟) - $COL1A1$(I型胶原,骨基质主要成分)[^1] - $BGLAP$(骨钙素,矿化标志) 2. **破骨细胞功能基因** - $CTSK$(组织蛋白酶K,骨吸收关键酶) - $ACP5$(TRAP,破骨细胞活性标志) - $NFATc1$(调控破骨细胞分化) 3. **软骨相关基因** - $SOX9$(软骨细胞分化) - $COL2A1$(II型胶原,软骨基质成分) - $ACAN$(聚集蛋白聚糖) 4. **骨发育信号通路** - Wnt通路:$WNT5A$, $LRP5$ - BMP通路:$BMP2$, $SMAD1$ - Hedgehog通路:$IHH$(调控生长板软骨细胞) --- ### 二、常用数据库与工具 1. **基因功能注释数据库** - **MSigDB**:搜索"bone mineralization"或"osteoblast differentiation"相关基因集(如`HALLMARK_OSTEOBLAST_DIFFERENTIATION`) - **Gene Ontology (GO)**:`GO:0030509`(骨形成)、`GO:0030574`(破骨细胞分化) - **CellMarker 2.0**:查询成骨细胞、破骨细胞、软骨细胞标记基因[^1] 2. **单细胞数据整合资源** - **Human Cell Atlas**:骨骼组织单细胞图谱 - **Tabula Sapiens**:跨器官基因表达参考 --- ### 三、分析方法 1. **功能富集分析** 使用`clusterProfiler`或`GSEA`验证骨骼相关通路在单细胞亚群的活跃程度。 2. **细胞类型注释** 在Seurat或Scanpy中通过`AddModuleScore`计算成骨/破骨特征基因评分: ```r osteo_genes <- c("RUNX2", "SP7", "COL1A1") seurat_obj <- AddModuleScore(seurat_obj, features = list(osteo_genes), name = "Osteo_Score") ``` 3. **跨物种比对** 利用`biomaRt`转换基因符号(如小鼠到人类同源基因)。 --- ### 四、注意事项 1. **数据预处理**:单细胞数据需先标准化并去除批次效应 2. **动态过程解析**:伪时间分析(Monocle3)可追踪骨细胞分化轨迹 3. **实验验证**:建议结合免疫组化或qPCR验证关键基因表达 ---
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值