Spanve:一种检测大规模空间转录组学数据中空间变异基因的有效统计方法

3 篇文章 0 订阅
2 篇文章 0 订阅

文章题目

Spanve: an Effective Statistical Method to Detect Spatially Variable Genes in Large-scale Spatial Transcriptomics Data

中文名:

Spanve:一种检测大规模空间转录组学数据中空间变异基因的有效统计方法

文章地址:
https://doi.org/10.1101/2023.02.08.527623

本文主旨

提出了Spanve(空间邻域可变表达基因),这是一种基于统计的方法,用于从空间转录组学数据中检测空间依赖性表达基因,通过将空间和表达的依赖性建模为两个分布的距离,该方法具有较高的计算效率和准确性。Spanve能够输入空间转录组并改进空间组织区域的识别。

出发点

  作者认为 判断空间转录组学数据的空间模式,需要找到 HVG 高可变基因 或者说 找到SV spatially variable gene 。因为SV基因可由细胞类型定位或空间依赖性细胞相互作用引起,因此可用于多个下游分析,例如重建组织结构。SV基因也有助于提供生物学见解,因为不同的空间表达模式反映了不同的基因功能。
  目前的找到sv的方法 取决于 使用协方差矩阵或者说使用聚类方法 他们都不适用于大规模数据集。
  此外,基因表达建模技术经常依赖于高斯分布或泊松分布,这可能导致较高的假阳性率,因为并非所有基因表达都符合这些假设。

  Spanve这个方法考虑到了 上述所说的问题 不考虑将细胞内的表达建模为传统的统计类分布(经典的几种分布)而转换使用细胞与空间邻居之间的差异性。
  由于可能存在位置效应,包括细胞类型分布、局部环境和细胞相互作用,简单分布可能无法描述基因表达,而复杂分布则大大增加了参数的数量和拟合时间。没有基因表达分布的假设,Spanve能够准确地识别具有空间表达模式的基因
  此外,通过考虑细胞与空间之间的作用,spanve可以感知空间domain
   此外 ,还采用了空间插补方法。

评价指标

使用Moran’s I指数:

https://www.jianshu.com/p/305c608f2884?ivk_sa=1024320u

使用Geary’s C指数:

这个其实和上面的莫兰指数差不多:

  二者区别和联系

moran 和 geary本身都代表空间自相关性

Spanve在 Moran 和 Geary上的效果都是最好的:
(https://note.youdao.com/yws/res/4819/WEBRESOURCE183c8eef2e9003c73909c2e5e2447c6d)]

CH index

CH指数越高,SV基因作为特征的数据越有可能获得基于原始数据的聚类标记,这意味着SV基因更能代表原始数据。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-n0ovEqyJ-1677834498096)(https://note.youdao.com/yws/res/4823/WEBRESOURCEa91b9774f9cf2de434d4bcd4a547a869)]

结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sZrj0PqD-1677834498096)(https://note.youdao.com/yws/res/4825/WEBRESOURCEa620dd810f5c17901ec9f4e42ce4efaa)]

插补的引入

SPANGE同时引入了插补的概念!这个用于检测生成差异表达基因(SV)的工具同时可以用于插补 插补的方法如下
(https://note.youdao.com/yws/res/4831/WEBRESOURCEc6218c7b3d63e7d7e877f8128ef7fed2)]

结果说明

(https://note.youdao.com/yws/res/4838/WEBRESOURCE463d5961ff975317961fdaf2be2128b6)]

插补后数据的AMI和ARI有着显著的提升
(https://note.youdao.com/yws/res/4833/WEBRESOURCE1e0df0375e58f9a7ebd8336b211c3e41)]

  Spanve插补后聚类有了很大改善,可以获得更清晰的组织层边界

总结

Spanve作为一种新开发的空间可变基因(SV)识别方法,该方法可提供可缩放的集群感知基因。本文作者估计,随着空间转录组学数据规模的扩大,可扩展性将变得更加重要。与当前方法相比,Spanve在大规模空间转录组学数据中需要最少的时间和计算成本。此外,Spanve鉴定的基因在空间上更加异质,有利于进一步聚类。Spanve作者团队同时还创建了一种空间插补方法,该方法允许使用流行的聚类方法来识别更准确的组织结构。

限制和不足

一个限制是它不能同时处理来自类似组织切片的数据,以检测稳健的SV基因并利用先前的数据。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值