Science Bulletin | 乳酸菌数据库iLABdb助推乳酸菌资源的深度开发和应用

乳酸菌作为微生物领域重要的战略资源,在食品加工、农业种植、动物养殖以及生物制药等领域具有广泛的应用价值。然而,与其巨大的应用潜能相比,目前对乳酸菌资源的全面理解尚处于起步阶段。内蒙古农业大学张和平及团队在Science Bulletin发表最新研究,构建了一个综合性的乳酸菌基因组数据库iLABdb(https://www.imhpc.com/iLABdb)。iLABdb共包含62900个非冗余乳酸菌基因组(67.3%是分离株,32.7%是MAGs),其中超11000测序的乳酸菌基因组,菌株的主要来源是人类(57.7%)和食物(18.2%);收集并验证了1054项临床益生菌干预研究,以促进科学循证和医学研究。

01fe9a7dcac52cac52addc22e15f1174.png

Figure 4.1: 首页设计采用大轮播平铺式布局,网站名字/菜单导航 + 全屏轮播图/搜索 + 地图 + 数据库描述、色块统计信息(点击可跳转对应的数据浏览页面)。轮播体现数据库特色、直观、美观,大气呈现。

4.1 数据浏览(Visualize)

数据浏览共包括4部分内容:基因组、物种、临床益生菌干预研究、明星菌株。从4个层面分别展示了乳酸菌的资源和应用信息。

4.1.1 基因组数据可视化(Genome)

基因组数据检索与可视化,首先从整体上对基因组数据的分布以可交互式饼图的形式做了统计展示,用户点击饼图的扇区,即可对下方数据表实现联动筛选。

d58b4f95efde39dd9d14081724735658.png

Figure 4.2: 基因组信息统计。普通表格展示太枯燥,这里对表格的关键信息用饼图展示,一目了然基因组的关键属性信息及其数量分布;每个属性有多少类,每类基因组相对多少,增加了页面的丰富性,且方便筛选某一类基因组。表格可选择展示哪些列,适应大小屏幕展示。表格采用分页表格,按需向后台访问数据,单次加载数据少,加快了加载速度,且可全局搜索,方便查看特定类型基因组。

点击基因组编号(如iLABdb.g1000),可跳转至该基因组的详情页面,包括基因组的基本信息、组装信息、菌株名(该基因组对应的菌株如果有多个别名,该数据库也做了详细收录)、基因注释、CAZy/VFDB注释、KEGG分析、短链脂肪酸代谢通路、关键因子的基因组分布(ref:ilabgenome002) 基因组详情页。详情页面展示的内容非常丰富;右侧有目录导航既是页面内容的概览,又方便快速跳转。丰富的可交互式图(旭日图柱状图环形图染色体结构图)多层次呈现数据信息,增强了基因组信息的可视化效果,用户可以非常直观的认识一个基因组的详情信息。点击KEGG module`的编号,可跳转至KEGG数据库对应的页面。

9001937cb6c966c417d63c152cf9e32e.png

Figure 4.3: (ref:ilabgenome002)

4.1.2 物种数据可视化(Species)

物种信息的检索及可视化。本数据库主要集成的乳酸菌的物种数据,从科(Family)和属(Genus)水平上进行了统计展示。

abd943d725d721b72dd9c45929113c79.png

Figure 4.4: 物种信息统计.普通表格展示太枯燥,这里对表格的关键信息用饼图展示,一目了然物种的关键属性信息;每个属性有多少类,每类基因组相对多少,增加了页面的丰富性,且方便筛选某一类物种。表格可筛选显示关注的列信息,适应大/小屏幕展示。表格采用分页表格,按需向后台访问数据,单次加载数据少,加快了加载速度,且可全局搜索,方便查看特定类型物种信息。

在表格中,点击物种ID可跳转至该物种的详情页,点击基因组ID会跳转至对应的基因组详情页。物种详情页,主要展示了物种的基本信息、全球地理分布、以及该物种下的基因组列表。

ede43456f770509ee03193551622f6bc.png

Figure 4.5: 物种详情页。详情页面,基本信息展示了物种的taxonomy分类信息、clusterID以及该物种包含的基因组数量。以交互式地图和饼图的形式展示了该物种基因组的地里分布及样本来源。数据表中展示了每个基因组的具体信息,点击ID可以跳转至相应的基因组详情页。

4.1.3 临床益生菌干预研究(Clinical Trial Results)

临床益生菌干预研究数据的检索及可视化。该部分数据可通过人体结构疾病类型进行项目数据的查询,也可通过检索框进行全局检索。

f52c7c003058536dbd8500353f839b4e.png

Figure 4.6: 临床益生菌干预研究检索页面。

该页面中用户可通过三种方式检索数据。

(1)检索框

c595a36d51d649453b4910b1fc8dc518.png

3a62ba8e52c191cf96b707b24f0673f3.png

Figure 4.7: 检索形式及结果展示

(2)人体器官展示相应的疾病和益生菌研究数目

a35d35d9856e659ad2a0a740bff1f8cb.png

f9ed942e274516f77d822e52eb0d1b44.png

Figure 4.8: 人体器官检索

(3)玫瑰图展示不同疾病对应的益生菌研究项目的数目

0f8fb6ce2cbc428e7b3a700f1bf46aab.png

Figure 4.9: 玫瑰图检索

4.1.4 明星菌株(Star LAB strains)

明星菌株页面描述了入选明星菌株的基本条件。同时展示了现有明星菌株的基因组、动物实验、临床实验及发酵工业中的应用等详细信息。

33795126b76ae85e962f9bf2cd2b0104.png

Figure 4.10: 明星菌株。以动态气泡图的形式展示了明星菌株。气泡中的图片代表明星菌株的分离来源,气泡的大小代表该明星菌株相关的研究数量,点击任意气泡,可以查看详情信息。

4.2 数据分析(Analyze)

分析工作流是利用Snakemake(版本7.24.0)建立的,可高效注释分离菌基因组或宏基因组 MAG 基因组数据。主要功能包括:

  1. 常规注释:Bakta v1.7

  2. KEGG注释:eggNOG-mapper V2.1.10

  3. CAZy功能注释:dbCAN v4.0.0

  4. 噬菌体预测:PhiSpy v4.2.21

  5. 毒力因子注释(http://www.mgc.ac.cn/VFs/download.htm):Diamond v2.1.4

  6. 代谢基因簇:gutSMASH

  7. 最大增长率预测:gRodon v2

  8. 抗生素耐药性基因分析:ABRicate v1.0.0

96bca3621e8d196aba1621c7d18832e0.png

de7d61226d46e67dbd0167c52fb93b16.png

60f8bb77bff8e9ca968ed7422bb1f782.png

69a4873a1734c358d78a76002b08348f.png

Figure 4.11: 基因组分析。以色块的形式统计目前平台任务运行的情况,表格展示每个任务的状态信息,比如提交时间、运行状态、任务名称等。用户可根实际情况判断是否提交新的任务。任务提交后,会以进度条的形式展示任务的状态。任务完成后,用户可以点击Result在线查看分析结果,也可以点击Download下载分析结果至本地。

4.3 数据汇交(Submit)

本平台支持乳酸菌数据资源的汇交。主要包括三种类型:基因组数据明星菌株数据临床益生菌干预研究数据

4.3.1 基因组数据(Genome)

需提交基因组的元数据和组装后的基因组Fasta格式的文件。提交后,用户可凭邮箱地址查看历史数据。

33d8cbc514114c4560910ff2e611334e.png

08f8e072942e86e0062fed014039e451.png

Figure 4.12: 基因组数据汇交。下载元数据模板,填写后上传,并上传序列文件。

4.3.2 明星菌株(Star LAB strains)

明星菌株的数据相对较为复杂,该部分主要是文件数据和图片。元数据表主要写清楚明星菌株的相关描述信息及对应的文件名和分离源图片的名称。

ab24d8f26d1341d570246ed106f5b7ca.png

Figure 4.13: 明星菌株数据汇交。下载元数据模板,填写后上传,并上传相应文件。

4.3.3 临床益生菌干预研究数据(Clinical trial data)

按照系统提供的模板整理数据,上传即可。

cd5e8ccb6bf3a7039d27a9b4f93c56c5.png

Figure 4.14: 临床益生菌干预研究数据汇交。下载元数据模板,填写后上传。

4.4 数据库成果

该数据库为内蒙古农业大学张和平团队等开发,于2023年9月12日在线发表于《Science Bulletin》,题为The iLABdb: a web-based integrated lactic acid bacteria database

342b4f7e6cdb0e5bfdf926d1539b6aaa.png

Figure 4.15: 在线发表论文

4 篇 NAR | 生物大数据时代,如何做好数据管理和再利用,发IF10+的数据库文章?

往期精品(点击图片直达文字对应教程)

cdfa1fd9ca40c95c3af519a8f50da5f1.jpeg

7b0daadaffa291e59d1b498515f2131b.jpeg

fde375db3e3dd86a811e4313fd8dec65.jpeg

c703fd8fafa1b0fc8686503351e68739.jpeg

fefb1be5d25617ad0352287294ba2a42.jpeg

6c9387189c01759c95470c83727fc2cc.jpeg

d4aa81c1e6536516fec584fde261fb7a.jpeg

81c5187f717e31fde382248816659421.jpeg

1c101ccdf97c3a89b143e5890dda673c.jpeg

1f108b7b0f4c92ece58cbe0f05122583.jpeg

0777a5df3a96698eeaa858a9ae5935cf.jpeg

f1a795abee0a89186df2817d2e394b43.jpeg

b4ac8854075690d2d358f33d3de64f62.png

c8f58da3f936fbb21aec54a5f7bed8ab.png

d348bedbbc44099bb96d3f74a78ac340.png

cb8633aad33803006cc6f7de3f624350.png

410aafd12b99eea48ab3a0ce246544fa.jpeg

c3c5fa6ab09236fb37407a5bde43842e.jpeg

cf5ef077e52dff5f6f26ebae8881029a.jpeg

6e30fbc4195cffda41b81ae133463d8a.jpeg

8ff6b3647c638811d8db7d669f509b9b.png

dbf7dc221682840c4d6a8017f669d4b4.png

1cec8810e3e6078ae64de47f15530f57.jpeg

dbe7894075ec5ac5675ebbc0e85ffb65.png

8b87d30b5c4dc76ac626abf6744e0a68.png

a907a11cf8bafa318294237af5674465.jpeg

de3eacc15a09bf5fdc0f01fa4568d02d.png

da34aebe8996f55d898390411de059d1.png

机器学习

999e22d8f0f7d2d005feeddc0f5ba99f.png

dac08ae7c7a2afe299f4c8232bed3bba.jpeg

c71cf3ee9a77d94d9480d4ed0c42a63b.jpeg

077320b11423f8d7c7980ddd57840e00.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值