SCS【30】单细胞空间转录组学数据库(STOmics DB)

19041843ea4f69f980c5caaa062dbaac.gif


单细胞生信分析教程

桓峰基因公众号推出单细胞生信分析教程并配有视频在线教程,目前整理出来的相关教程目录如下:

Topic 6. 克隆进化之 Canopy

Topic 7. 克隆进化之 Cardelino

Topic 8. 克隆进化之 RobustClone

SCS【1】今天开启单细胞之旅,述说单细胞测序的前世今生

SCS【2】单细胞转录组 之 cellranger

SCS【3】单细胞转录组数据 GEO 下载及读取

SCS【4】单细胞转录组数据可视化分析 (Seurat 4.0)

SCS【5】单细胞转录组数据可视化分析 (scater)

SCS【6】单细胞转录组之细胞类型自动注释 (SingleR)

SCS【7】单细胞转录组之轨迹分析 (Monocle 3) 聚类、分类和计数细胞

SCS【8】单细胞转录组之筛选标记基因 (Monocle 3)

SCS【9】单细胞转录组之构建细胞轨迹 (Monocle 3)

SCS【10】单细胞转录组之差异表达分析 (Monocle 3)

SCS【11】单细胞ATAC-seq 可视化分析 (Cicero)

SCS【12】单细胞转录组之评估不同单细胞亚群的分化潜能 (Cytotrace)

SCS【13】单细胞转录组之识别细胞对“基因集”的响应 (AUCell)

SCS【14】单细胞调节网络推理和聚类 (SCENIC)

SCS【15】细胞交互:受体-配体及其相互作用的细胞通讯数据库 (CellPhoneDB)

SCS【16】从肿瘤单细胞RNA-Seq数据中推断拷贝数变化 (inferCNV)

SCS【17】从单细胞转录组推断肿瘤的CNV和亚克隆 (copyKAT)

SCS【18】细胞交互:受体-配体及其相互作用的细胞通讯数据库 (iTALK)

SCS【19】单细胞自动注释细胞类型 (Symphony)

SCS【20】单细胞数据估计组织中细胞类型(Music)

SCS【21】单细胞空间转录组可视化 (Seurat V5)

SCS【22】单细胞转录组之 RNA 速度估计 (Velocyto.R)

SCS【23】单细胞转录组之数据整合 (Harmony)

SCS【24】单细胞数据量化代谢的计算方法 (scMetabolism)

SCS【25】单细胞细胞间通信第一部分细胞通讯可视化(CellChat)

SCS【26】单细胞细胞间通信第二部分通信网络的系统分析(CellChat)

SCS【27】单细胞转录组之识别标记基因 (scran)

SCS【28】单细胞转录组加权基因共表达网络分析(hdWGCNA)

SCS【29】单细胞基因富集分析 (singleseqgset)

我们每个人都是各有所长,各有所短,要知道并不是所有人都能写代码,就像读书的时候同学们的偏科现象,有的人就非常擅长文科,而有的人就非常擅长理科,同理,现在有的同学擅长实验,有的同学擅长算法编程,各有千秋,所以当擅长实验的同学希望通过分析先找到一些潜在的 biomarkers,比如利用单细胞数据来筛选 biomaker,那怎么办呢?

今天来介绍一款单细胞空间转录组在线数据库工具——STOmicsDB 的使用方法,利用便捷的在线工具结合自己的实验结果也可以发高分!

f400ea1c51f394d3ea3dc18e4a5d0303.png

简     介

空间转录组学的最新技术发展使研究人员能够在几乎单细胞水平上测量细胞的基因表达及其空间位置,从而对生物过程产生详细的生物学见解。然而,专门的空间转录组学数据库是罕见的。在此,我们介绍了空间转录组数据库(STOmicsDB),这是一个用户友好的数据库,具有多种功能,包括搜索相关出版物和工具,公共数据集可视化,定制专业数据库,新数据存档和在线分析。当前版本的STOmicsDB包括涵盖12个物种的141个精选空间转录数据集,包括5,618篇空间多组学出版物和674个工具。https://db.cngb.org/stomics/

ae141be39d478a2699573d7d35b3d431.png

STOmicsDB由五个模块组成:资源中心模块、数据探索模块、定制数据库模块、在线分析模块和数据提交模块。用户可以通过STOmicsDB首页顶部的导航栏访问各个模块。

  • 数据探索模块

f0b48fd7bb884df24bd9734555ce0414.png

根据时间段选择数据集,直接点击 “Date range”,然后填写时间段,右侧就会出现对应的文章以及数据相关信息,如 Species, Technology, ID, PMID

8e4a9abf71aeedb2c12dfdfb404241d6.png

根据物种选择数据集,选择“Species”, 目前线上支持18个物种,比已发文章多了6个物种,数据库也是不断在更新的。

426c2e43756f770c86aac023bfa493ca.png

根据测序技术选择数据集,选择“Technology”, 测序技术还是多种多样的,非常多,每个处理方法还是有些不同,当自己处理这些数据肯定是很麻烦,但是在线工具都已经完成前期复杂的整合过程,是非常方便使用的,我们只需要在这里下载 Matrix 和 cell labels,是不是很方便,这也就是学会利用数据库,效率倍增。

e78ec5d85bf08bab5f8adce41ff6a6ef.png

根据数据质量选择数据集,这时需要我们理解一下不同个数的星星代表质量的高低意义:

5★ Contains spatial coordinate information and images.

4★Only contains spatial coordinate information.

3★ Only contains spatial images.

2★ Missing space coordinate information and spatial images.

1★ File not processed.

48cd31efcfa6dd8ef117aad30818974a.png

  • 资源中心模块

为满足资源获取方便的需求,STOmicsDB提供了一个全面的空间资源检索和浏览中心,包括三个部分:

(i)空间转录组数据集;

(ii)空间多组学出版物;

(iii)空间多组学工具。

空间转录组数据集部分提供数据可视化和分析数据下载,而空间多组学出版物和工具部分包含相应的元数据和每条记录的简要介绍。此外,STOmicsDB对每个部分都有不同的分类。例如,出版物部分包含研究领域、物种、组织、空间分辨率和出版物类型,而数据集部分包括数据集发布日期、物种、组织、空间转录组学技术和数据质量。用户可以通过本体分类指定感兴趣的记录。此外,每条记录都有一个单独的页面,其中显示详细信息,例如其摘要和相关链接。

9d4bec071229f94880abb018a3036a20.png

  • 定制数据库模块

这个模块六大数据库,不断得收集与每个物种有关的数据,并对数据进行可视化分析,比如聚类,热图,点图以及每个基因的小提琴图。

fc880b5cacf1d5a488a2718a04ec16ca.png

比如我们选择 MOSTA 搜集的MOSTA数据库共有53个C57BL/6小鼠胚胎矢状面切片,分别为E9.5 (~7.1 mm2)、E10.5 (~11.5 mm2)、E11.5 (~18.8 mm2)、E12.5 (~32.1 mm2)、E13.5 (~48.4 mm2)、E14.5 (~64.1 mm2)、E15.5 (~70.8 mm2)和E16.5 (~76.1 mm2),采用Stereo-seq技术。对于e9.5 ~ e15.5期,从不同的重复中选取4 ~ 6个切片。对于E16.5,从两个生物重复中绘制了17个矢状面切片,其中13个切片来自一个胚胎,可以覆盖所有主要器官/组织。在MOSTA中,我们提供了每个胚胎矢状切片的基因表达、基因共表达模块和调控的空间图。我们的全景地图集将允许深入调查有关哺乳动物发育的长期问题。

680f4eb557c8344b025f9246d067159b.png

a). 绘制聚类图,这里面我们可以通过选择左侧选项筛选数据集,以及右侧筛选不同的器官。

5106d946aa4c7c8a3b732b75aea6c400.png

b). 绘制热图,通过“annotion”筛选基因,这里选择了 “Marker gene”。

ccfd35c89f37b135a64b225629cbcfa2.png

c). 绘制点图,通过“annotion”筛选基因,这里选择了 “Marker gene”。

d526a054517085f32cccaa3c2151b01c.png

d). 绘制每个marker gene的小提琴图,通过“annotion”筛选基因,这里选择了 “Marker gene”。

47bd5ce63febb3571dd5adf9e04a17c0.png

  • 数据提交模块

STOmicsDB数据归档系统是一个通过用户提交收集空间转录组数据的综合性存储库。STOmicsDB数据存档系统接受来自原始测序数据的空间转录组数据,以及用于分析结果的图像信息,增强了空间转录组数据的可重复性。此外,STOmicsDB还提供了归档数据的可视化,以方便新的数据分析。

2148cd1ba6a0bb42cac4a0344d406aad.png

STOmics数据归档的标准将帮助您理解必须提交哪些数据?

我们可以先下载在线工具的数据提交模板数据作为参考。点击 “STOmics Data submission template”

832e5981dc34554c3f235e71f2de3f2c.png

进入 "FTP public service",就可以根据模板数据上传自己的数据了。

5f99c821d9475d86c70d3894847d538f.png

  • 在线分析模块

为了观察用户细胞标签在空间转录组数据中的分布情况,我们使用singleR将用户细胞标签映射回空间转录组。虽然空间分辨转录组学技术,如ST和Visium,已经揭示了不同组织类型和疾病的精细尺度细胞空间。ST和Visium的主要技术限制是缺乏单细胞分辨率和每个点捕获5-10个细胞的能力,这意味着对于大多数组织细胞来说,同一类型的细胞更有可能分散在同一区域。

a). 基因注释模块 "SingleR", 关于“SingleR”软件包的使用可以参考SCS【6】单细胞转录组之细胞类型自动注释 (SingleR)。这里我们可以直接 “RUN DEMO”,也可以下载 "Demo matrix file" 和 “Demo cell label file”,我们就直接 “RUN DEMO”。

7d9e604fcd3f209e4cd62f0b5a157b0a.png

然后右侧出现等待的页面,显示 "Status:RUNNING"。

bcfdd5fafdf184788488ec26df595130.png

大概1分钟左右,就会出现“Status:SUCCESS”,这时就可以下载分析结果了。

c98500d298747368ed762ab0fe914380.png

下载之后,我们看到压缩包里面包含的所有文件内容:

6c7cf200518b1f5378434491807842db.png

首先是“.\figures”里面包括一张单细胞注释后的图“spatialembedding.png”。

91d5f33812d82c42947e6901f7cacd8e.png

然后还有一张主要细胞类型图“anno_main_distribution.pdf”。

2372b7d508309dab468fbccfaf69706b.png

最后还有一张细胞注释类型的热图 “anno main heatmap.pdf”

8e029c2a73f564e53284298998ba8ff7.png

还包含细胞注释后的表格“SingleR_result.csv”。

ad6163de8384db34807c7f7863f3276c.png

b). 基因搜索模块 “gene research”,选择物种和基因,显示相应基因在不同数据集片段中的空间图。单击 “Search ” 以进入相应的数据集可视化以获取更多详细信息。

89c6a3489632201149648421a8e1a541.png

显示对应基因在不同数据集的不同片段之间的空间图。你可以观察到

  1. 多重视角

  2. 不同的发展阶段

  3. 不同的癌症类型

  4. 不同的组织,正常和病变

5cecbe14f029c3c47676a8e481148a1a.png

这时我们又可以进入“MOSTA”数据库中,这里也会有对数据的可视化,总结,数据下载以及分析的功能,同以上模块讲过的一样使用。

e88c8abf11da657d93b5f71bdabf2000.png

数据集总结:

26fa40e1467dc6d4fc813dd8deda5164.png

数据下载,这里也会有几种数据类型选择,根据需求自行选择下载数据。

0cace9848a2a079251f19eeb879c42e8.png

数据结果暂时未开放,但其实用法同“数据分析模块”相同。

c). 数据比较分析模块“Compare”,  比较STOmicsDB中两个数据集的空间基因表达。这里会出现两套数据集进行比较,我们看到左边是“E12.5”,右边的是“E16.5”。

bad62c19f2a0013a8722e7a942876b03.png

在左侧最下面有个“More explore”,点击进去就会出现整体数据的展示。

ea8044498b3e2828dbcec7cddd8af364.png

95c075f47f58f5a90a9e7c70d84518f8.png

d). 立体映射图 “Stereomap”, 这个就不多说了,可放大,缩小,选择基因,图层,以及bin值,很简单好操作。

7952ebc3d544a9c75c29056ad94fa0ba.png

最后说一下网站可归档的要求,自己的数据可参考上传。

fe0fa1a44ef5b27eb029695983e454f5.png

生信分析利用好各类数据库,会出现事半功倍的效果,对于这么复杂的数据整合,只需要在网站上点,点,点,根据自己的课题设计点出图表就完成了初步的分析结果,再加上自己的验证,高分文章 “一点” 搞定,还不快来学起来!!!

Reference:

1. Xu, Z., Wang, W., Yang, T., Chen, J., Huang, Y., Gould, J., Du, W., Yang, F., Li, L., Lai, T. et al. (2022) STOmicsDB: a database of Spatial Transcriptomic data. bioRxiv, 2022.2003.2011.481421.

桓峰基因,铸造成功的您!

未来桓峰基因公众号将不间断的推出单细胞系列生信分析教程,

敬请期待!!

桓峰基因官网正式上线,请大家多多关注,还有很多不足之处,大家多多指正!

http://www.kyohogene.com/

桓峰基因和投必得合作,文章润色优惠85折,需要文章润色的老师可以直接到网站输入领取桓峰基因专属优惠券码:KYOHOGENE,然后上传,付款时选择桓峰基因优惠券即可享受85折优惠哦!https://www.topeditsci.com/

6455e39e2e6391c3ceccabe84a128bfa.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值