iMeta | 广西医科大安三奇等开发肠道疾病多组学数据库GutUDB

点击蓝字 关注我们

肠道宇宙数据库(GutUDB):一个全面的肠道疾病多组学数据库

1ca38f3f1c42674bb939ab074e6f02cb.png

iMeta主页:http://www.imeta.science

方法论文

● 原文链接DOI: https://doi.org/10.1002/imt2.195

● 2024年4月27日,广西医科大学安三奇、梁浩,广州安金公司梁帅一和山东大学陈雪娜等团队在iMeta在线联合发表了题为 “GutUDB: A comprehensive multiomics database for intestinal diseases” 的方法文章。

● 本研究介绍了肠道宇宙数据库(GutUDB),该数据库提供了一个用户友好型平台,用于全面收集八种类型的组学数据,包括表观组学、基因组学、转录组学、空间组学、单细胞组学、蛋白质组学、代谢组学和微生物组学数据,涵盖六种不同物种的 56 种不同肠道疾病。

● 第一作者:包苡、陈亚鑫、林丽珠、李静怡

● 通讯作者:安三奇(ansq@mail2.sysu.edu.cn)、梁帅一 (SLiang2@my.harrisburgu.edu)、梁浩(lianghao@gxmu.edu.cn)、陈雪娜 (chenxuena2021@sdu.edu.cn)

● 合作作者:刘欣丽、王刚、李玥琪、林垚、陈雅婧、周丽娟、祁雅文、谢玉芳、林镇瑞、孙哲、范语雯、江金静、张飞宇、陈湖彬、褚洁梅、黄颉刚

● 主要单位:广西医科大学艾滋病防治研究重点实验室、四川大学疾病分子网络前沿科学中心、钦州市第一人民医院麻醉科、广东省第二人民医院病理科

亮   点

c3e03934a429bb0ad98dda83f5beff6f.jpeg

●  GutUDB是首个涵盖组学水平最广泛的肠道疾病数据库,整合了来自11种肠道组织亚型和63种肠道相关细胞系的58,970个基因,涵盖260,790 个疾病基因关联,并纳入了各种临床疗法,包括化学药物、传统药物和益生菌制剂;

●  组学水平涉及表观组学、基因组学、转录组学、空间组学、单细胞组学、蛋白质组学、微生物组学、代谢组学;

●  GutUDB 提供四种关键工具—浏览、查询、可视化和下载功能—帮助用户能够轻松地理解复杂的基因-疾病-组学关系。

视频解读

Bilibili:https://www.bilibili.com/video/BV19H4y1G7eN/

Youtube:https://youtu.be/j7AXQiqoyNM

中文翻译、PPT、中/英文视频解读等扩展资料下载

请访问期刊官网:http://www.imeta.science/

全文解读

引  言

肠道是消化系统的核心器官,负责营养吸收和消化过程。近年来,高通量测序技术从DNA水平过程、转录动态、蛋白质相关活动和表观遗传修饰等多个方面极大地拓宽了我们对生物机制的理解。这些不同的组学测序数据可为我们提供更系统、更深入的肠道疾病洞察。然而,测序数据分析技术的复杂性,加上数据存储的分散性和数据集的庞大性,阻碍了研究人员对这些组学资源的充分利用。因此,当务之急是建立一个综合数据库来整合和分析这些测序数据集,这将有助于应对这些挑战。

在这里,我们介绍了肠道宇宙数据库(GutUDB),这是一个有关肠道疾病的高质量、综合性多组学数据库。它提供了一个用户友好型平台,用于全面收集八种类型的组学数据,包括表观组学、基因组学、转录组学、空间组学、单细胞组学、蛋白质组学、代谢组学和微生物组学数据,涵盖六种不同物种的 56 种不同肠道疾病。GutUDB对肠道疾病进行了全面分析,通过各种信息图表展示了多组学数据。我们纳入了适用于治疗肠道疾病的化学药物和传统药物,以及益生菌制剂。GutUDB 将在确定肠道疾病的诊断靶点和揭示这些疾病进展的分子机制方面发挥关键作用。

结  果

GutUDB 概述

目前,GutUDB 已从八大组学数据集中生成约 900 万个图例,其中包括人类(Homo sapiens)、家鼠(Mus musculus)、挪威鼠(Rattus norvegicus)、猕猴(Macaca mulatta)等六类物种相关的56种肠道疾病。总体而言,GutUDB 纳入了11种肠道组织和63种肠道细胞系的58,970个基因,并确定了各种潜在的临床疗法,包括化学药物、传统药物和益生菌制剂。为了帮助用户更加轻松地理解和查询错综复杂的基因—疾病—组学网络,GutUDB集成了四项核心功能:浏览、查询、可视化和下载(图1A)。

78a921aed58a3ff3829fca422e72ce92.png

图1. 肠道宇宙数据库(GutUDB)的内容和功能

(A)数据收集和处理过程,以及数据库网站的构建过程,包括四个核心功能(浏览、查询、可视化和下载)。(B)METTL3 在不同组织中的表达水平,数据来源于GTEx。(C)箱线图显示结肠癌组织和健康组织的基因表达差异。(D)散点图显示结肠癌组和健康组之间METTL3基因表达的相关性分析。(E)结肠癌相关基因POLE 的生存分析曲线。(F)scRNA-seq数据中CNPY3在不同细胞中的表达水平图谱。(G) MUTYH在结直肠癌中的H3k27me3、m6A位点以及 RNA-seq和SNP数据的读数覆盖率的轨迹。

不同肠道疾病之间的疾病基因关联

GutUDB 中总共嵌入了 260,790 个疾病基因关联。与肠道相关的主要疾病包括结肠癌、结直肠癌、结肠出血、直肠癌、便秘、腹泻、回肠炎、炎症性肠病和小肠癌(图 S1A),关联性排名前十的基因为STK11、CFTR、BMPR1A、SMAD4、NOTCH1、PKD1、MLH1、MSH2、APC 和 MEFV(图S1B)。STK11 是的 Peutz-Jeghers 综合征的相关基因。SMAD4 和 BMPR1A 与幼年多发性息肉综合征有关。这些发现说明了肠道病变与这些基因之间的密切关系。

为了进一步探索与肠道疾病相关的特定基因,用户可以在主页上通过输入基因符号即可获取详细信息。以METTL3为例,点击“搜索”图标后,页面展示该基因的详细信息,如基因组位置和功能特征(如RNA结合蛋白或转录因子)(图S1C),以及在不同组织中跨越8个组学水平的表达水平和模式图(图1B)。我们观察到,在结肠癌中,METTL3 的拷贝数变异(CNV)缺失频率仅为 0.04,而该基因的 RNA 表达量却很高。我们的结论是,CNV RNA表达与METTL3之间存在微弱的相关性,其他表观遗传学和蛋白质组学数据也可以进行类似的相关性分析(图S1D)。此外,GutUDB还提供了结肠癌患者中具有差异表达和生存预后的基因集信息(图1C-E)。

四个核心模块:疾病、治疗、物种和组学数据

GutUDB 主要分为四大模块—物种(PECIES)、疾病(DISEASES)、组学(OMICS)和治疗(THERAPY),方便用户点击主页上的每个图标访问和浏览相应的详细信息。在“治疗”模块中,GutUDB整理出了21,984种药物与疾病的相互作用,包括6,281 种化合物、393 种传统药物和22种益生菌(图S1E)。在这些关联中,顺铂作为结肠癌患者的化疗药物,可渗入肿瘤细胞,诱导DNA损伤,最终导致细胞死亡。结果表明,顺铂在药物—疾病—基因网络中具有很强的连接性,这凸显了GutUDB中信息的可靠性和可访问性。在“疾病”模块中,用户可以深入了解不同组学水平的各种肠道疾病相关的基因(图S1F)。在“物种”模块中,用户可以浏览所有基因并选择自己感兴趣的物种(图S1G)。为了方便用户通过输入关键字(如基因名或特定类型的肠道疾病)或点击当前页面顶部的项目(如组学水平或热门基因)来有效检索和筛选结果,网站的所有结果都以表格形式呈现。

浏览肠道疾病相关的空间组学和单细胞组学数据

空间组学和单细胞测序方法极大地推动了对细胞异质性、免疫调节和肠道疾病分子机制的研究。GutUDB 中的空间组学数据揭示了不同样本中肿瘤特异性基因的复杂空间表达图谱以及注释图谱。选择基因后,用户可以在GutUDB中浏览空间组学数据的基因相关信息。此外,我们还提供了 GutUDB 中空间组学数据的样本、组织类型、生物技术和基因表达谱的详细信息。基因表达的主页显示了单细胞RNA-seq的UMAP图,每个样本的详细页面包含了基因在不同细胞中的表达图谱(图1F)。此外,GutUDB还嵌入了与肠道疾病相关的单细胞基因表达、单细胞替代多腺苷酸化(APA)、单细胞替代剪接(AS)和单细胞蛋白质组学数据,方便用户从RNA和蛋白质等不同维度全面了解单细胞水平的调控机制。

与肠道疾病相关的多组学图谱的交互式可视化

为了便于整合和分析不同的数据集和数据类型,我们将不同的组学数据类型与 DNA、RNA、蛋白质和基因变异等其他方面之间复杂的相互作用结合起来。用户可以通过导航栏中的“Omics”选项浏览特定的组学类型。GutUDB 中集合了八种不同类型的组学,以实现交互式可视化。

表观遗传学在肠道疾病的发生和发展中发挥着至关重要的作用,研究人员在临床试验中筛选并利用表观遗传学分子作为诊断和预后生物标志物。在GutUDB中,表观组学主要包含三大部分的内容,其中包括 DNA 甲基化、组蛋白修饰(H3K27me3、H3K27ac、H3K36me3、H3K4me1、H3K4me3、H3K9me3)和染色体结构。其中,转录和转录后涉及RNA m6A修饰和可变剪接的调控机制是当前研究的重点。我们以 MUTYH 为例展示组蛋白修饰状态,特别是H3K27me3修饰(图1G)。

基于miCLIP-seq数据,GutUDB整理了1908个RNA m6A修饰位点。由于基因组学的改变会影响RNA修饰并导致基因转录水平的改变,进而影响蛋白质的表达水平。此外,GutUDB数据库还纳入了六种类型的可变剪接,包括外显子缺失、可变的5’端剪切、可变的3’端剪切、互斥外显子和内含子保留。我们以MUTYH为例,说明结直肠癌中替代剪接和m6A修饰的情况(图1G)。

在基因组学方面,GutUDB包括72,248个单核苷酸多态性(SNP)、54,131个拷贝数变异(CNV)、1097个染色体结构变异(SV)以及92,888个与不同肠道疾病相关的突变基因,详情请参见“统计数据”页面。值得注意的是,每个基因组变异都附有其在不同人群频率和数据来源。在此,我们展示了结直肠癌中 MUTYH 基因的 SNP 位点(图1G)。

在转录组学方面,收集了137个RNA-seq数据集,涉及约790万个转录谱,这些转录谱在不同条件下或不同组织中具有不同的基因表达模式(图S1H)。此外,与肠道疾病相关的非编码RNA也在单独页面展示,包括62个环状RNA(circRNA)、182个长非编码RNA(lncRNA)和58个microRNA(miRNA)。

在蛋白质组学和代谢组学的畸变对肠道疾病的病理生理学有重大影响。在GutUDB中,蛋白质组学数据提供了蛋白质特征的信息,包括功能域、活性位点和人工调控下的翻译后修饰。此外,代谢组学和微生物组学数据展示了2764种肠道微生物与代谢物之间的关系。

因此,GutUDB使研究人员能够从多个生物学层面和角度深入研究基因修饰的复杂关联,从而揭示基因调控的复杂过程。

2361387397a671925653eba08fbbdbd3.png

图S1. 网站其他部分的内容展示

(A)各种肠道疾病的比例。(B)与基因疾病相关的排名前10个基因。(C) 执行搜索功能后显示的基因详细内容。(D)与基因相关的八个主要组学信息。(E)治疗部分包含化合物、传统药物和益生菌。(F)疾病部分的详细页面展示。(G)物种部分的详细页面展示。(H)基因组学中数据集详细信息的页面展示。

讨论和未来方向

在这项研究中,主要的挑战是如何标准化整合不同平台的测序数据,如 RNA-seq和微阵列数据。诚然,测序平台和仪器存在差异,但我们的数据库 GutUDB 主要利用 RNA-seq 数据进行批量转录组学研究,因为它仍然可以进行有效的标准化和比较。整合包括转录组学在内的多种多样的组学数据,可以揭示病理变化,大大提高我们对疾病诊断、机制和治疗策略的理解。GutUDB必将成为广大用户的综合资源,如胃肠病学专业的临床医生、学术和科研机构的研究人员、大学的教育工作者和学生以及任何对肠道研究和临床应用感兴趣的人。用户可以直接通过GutUDB轻松获取与肠道疾病相关的大量组学数据,而无需在各种数据库(如非编码RNA数据库、空间组学数据库和微生物组数据库)中搜索特定疾病的信息。

随着各种测序数据的快速积累,我们将会经常更新GutUDB,并自豪地宣布 GutUDB将致力于成为全球社区的开放式资源,推动肠道疾病的研究。我们还计划在未来一到两年内将互动模型集成到GutUDB中,以方便平台上的用户进行实时交流。此外,我们还将在GutUDB中整合更全面的肠道疾病病理切片、肠道疾病放射组学和肠道疾病个体队列,确保获得最新、最广泛的肠道疾病多组学数据。

代码和数据可用性声明

本研究中分析的所有数据来源都包含在补充材料中(表S1)。GutUDB可在https://intestine.splicedb.net免费获取。本研究涉及的代码和文章中数字对应的数据表已上传至 GitHub https://github.com/Ansanqi/GutUDB。补充材料(方法、图、表、脚本、图解摘要、幻灯片、视频、中文翻译版和更新材料)可在在线 DOI 或 iMeta Science http://www.imeta.science/ 中找到。

引文格式

Bao Yi, YaxinChen, LizhuLin, JingyiLi, XinliLiu, GangWang, Yueqi Li, etal. 2024. “GutUDB:AComprehensiveMultiomicsDatabaseforIntestinalDiseases.” iMeta 3, e195. https://doi.org/10.1002/imt2.195

作者简介

a3e2376cf1a83eb8cf7d6197db7c3442.jpeg

包苡(第一作者)

●  广西医科大学流行病与卫生统计学2022级在读硕士研究生。

● 目前研究方向为表观遗传学及多组学数据库的构建,相关学术成果已发表于iMeta期刊。

9dd6a27644db6af3a81a93385107c9c0.jpeg

陈亚鑫(第一作者)

●  助理研究员,四川大学华西医院博士后,中国科学院大学博士

●  目前主持国家自然科学基金青年基金、省科技厅面上项目等多项课题,并以第一/共同第一作者发表论文8篇。

8de8533ec348c1e1c3083b71b98e811e.jpeg

林丽珠(第一作者)

● 广西钦州市第一人民医院(广西医科大学第十附属医院)麻醉科副主任医师,教学主任。

● 硕士毕业于广西医科大学,在iMeta等期刊发表论文8篇。

92799fc682def55ab25ee47a25382597.jpeg

李静怡(第一作者)

● 硕士毕业于广西医科大学医学生物化学与分子生物学专业。

● 目前就职于广东省第二人民医院病理科,以第一/共同第一作者发表论文2篇。

6fc9c88f71f12317bd2ee523cd271b9f.jpeg

安三奇(通讯作者)

● 广西医科大学高层次引进人才,教授,博导,中山大学附属佛山医院客座教授。

● 博士毕业于中山大学中山医学院,受国家留学基金委资助在瑞士洛桑大学和NIH资助美国阿拉巴马大学伯明翰医学院访学。获得八桂青年拔尖人才等省级重大人才项目支持,并主持国家自然科学基金在内基金5项。担任Oncogene, iMeta,Briefs in Bioinformatics 等多个高水平期刊审稿人和青年编委,发表论文 30 余篇,并被Faculty Opinions(原F1000 )列为推荐论文。

2b8d4caa89dc2b6d5a867c1b29ce4757.jpeg

梁浩(通讯作者)

● 医学博士,博士后,二级教授,博士生导师。

● 国务院特殊津贴专家,全国五一劳动奖章获得者,第二届中国流行病学优秀奖专家,第二届广西创新争先奖个人,第一批广西高层次人才,广西优秀专家,广西发展战略优秀专家,广西“新世纪十百千人才工程”人选,广西高校杰出科技人才,广西高校八桂学者,广西高校百名中青年学科带头人,广西流行病学优秀专家。近年来,先后主持国家科技重大专项、国家重点研发项目等国家级项目14项、省部级重点项目5项。在国内外学术期刊上共发表论文260余篇,其中SCI论文120余篇,主编专著2部,副主编教材1部,申请专利27项,获软件著作权4项。

2f618ba63afb0a6a00a7a3760c10865e.jpeg

陈雪娜(通讯作者)

● 山东大学基础医学院助理研究员,山东大学基础医学院医学遗传学系与系统生物医学系党支部副书记,山东细胞生物学会会员。

● 主要致力于m6A单碱基编辑器的开发和应用,利用不同生物模型,从更微观角度解析特定m6A在机体发育、肿瘤发生等重大生物学过程中的调控作用及分子机制。荣获山东大学青年教师教学比赛一等奖,评为山东大学青年教学能手。目前主持山东省青年基金1项,以第一作者身份以及共同作者身份在国际知名期刊Advanced Science、Nature Biomedical Engineering等发表文章。

57f1c52adc9ab06806a4d057f7d07b55.jpeg

梁帅一(通讯作者)

● 毕业于美国波特兰州立大学计算机专业,美国哈里斯堡大学网络安全硕士。

● 主要从事人工智能与大数据分析、全栈开发、网页设计等。曾在美多家企业实习和工作,拥有丰富的软件开发和数据库构建与分析经验。现为广州安金公司高级顾问,以通讯或者第一作者在iMeta 等期刊发表论文3篇。

更多推荐

(▼ 点击跳转)

高引文章 ▸▸▸▸

iMeta | 引用7000+,海普洛斯陈实富发布新版fastp,更快更好地处理FASTQ数据

c54f7046fe93baeb1771567f2b841595.png

高引文章 ▸▸▸▸

iMeta | 德国国家肿瘤中心顾祖光发表复杂热图(ComplexHeatmap)可视化方法

1cc4890c661877ac3c03e989a5d9cb4c.png

高引文章▸▸▸▸

iMeta | 高颜值绘图网站imageGP+视频教程合集                                        

d860ca02a35a89bae7316fedd398f2f3.png

16d727f180faaa3454ffc82d7b242f4d.jpeg

1卷1期

5f17f62f7307ca60b0a6e96cb1d9ec9b.jpeg

1卷2期

16dc0c99e94e1006c37fb4953ac3c0e6.jpeg

1卷3期

c59797405f046dd9efa78a95a5fd2976.jpeg

1卷4期

29d14ee24b2c5dec1d029b4096b9c206.jpeg

2卷1期

fb6285a73cf5abbcd82570bea36a13cf.jpeg

2卷2期

409ed3567fcf0c8037cec764332de8fe.png

2卷3期

0f5d8284b7faaeadbd41502c9742d1c8.jpeg

2卷4期

905d78cda97c786b54da7eb5f3f4554d.png

3卷1期

6d73190818556fce509001122da8161c.png

2卷2期封底

6e56c9add0857a8af1b10058c5be1aba.jpeg

2卷4期封底

2c5694a61177875bb3f3af424cb910a4.jpeg

3卷2期

期刊简介

“iMeta” 是由威立、肠菌分会和本领域数百位华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表原创研究、方法和综述以促进宏基因组学、微生物组和生物信息学发展。目标是发表前10%(IF > 20)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、50万用户的社交媒体宣传等。2022年2月正式创刊发行!目前期刊已经被ESCI、Scopus等数据库收录。

联系我们

iMeta主页:

http://www.imeta.science

姊妹刊iMetaOmics主页:

http://www.imeta.science/imetaomics/

出版社iMeta主页:

https://onlinelibrary.wiley.com/journal/2770596x

出版社iMetaOmics主页:

https://onlinelibrary.wiley.com/journal/29969514

iMeta投稿:

https://wiley.atyponrex.com/journal/IMT2

iMetaOmics投稿:

https://wiley.atyponrex.com/journal/IMO2

邮箱:

office@imeta.science

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值