区分癌症细胞和非癌症细胞的方法


前言

单细胞测序取样时由于癌症病灶区域界限不是很清晰和现实技术原因,不可能样本中的每个细胞都是癌症细胞,里面混杂着正常细胞。

有些研究会直接分选需要研究的细胞来保证肿瘤细胞纯度。

而有一些研究是直接将整个样本进行单细胞测序,这种情况下就需要算法推断来区分癌症细胞和非癌症细胞。

区分癌细胞和非癌细胞的理论基础:

非整倍体在人类癌症中很常见 (90%)。具有广泛全基因组拷贝数畸变(非整倍体)的细胞被认为是肿瘤细胞,而基质正常细胞和免疫细胞通常具有 2N 二倍体或接近二倍体的拷贝数分布

目前已知的区分癌症细胞和非癌细胞的方法有以下几种。


一、聚类或特定基因marker

通过聚类来区分癌细胞和非癌细胞。

通过marker来区分则需要一定的先验知识的准确性,这可能是比较难满足的。


二、inferCNV

1、原理

用来探索肿瘤单细胞转录组数据中体细胞大规模染色体拷贝数变异(如:整个染色体或大片段染色体的获得或缺失)。

用正常细胞作为参考组,和参考组拷贝数变异模式相似的即认定为非癌细胞。

生成的热图表示每条染色体的相对表达强度,同时,因为正常细胞作为比较,能很清楚的知道肿瘤基因组的哪些区域过多或较少。

2、所需文件

基因表达矩阵

meta矩阵

基因位置矩阵

同组织部位的正常细胞作为参考组(一般可以在GTEx网站下载)

3、局限性

不能准确地解析特定染色体断点的基因组位置,也不能根据非整倍体拷贝数谱正确分类肿瘤细胞和正常细胞。

参考:

探索单细胞测序中的恶性肿瘤细胞,一定不能少了它——inferCNV

单细胞转录组鉴定肿瘤细胞:CopyKAT和InferCNV


三、HoneyBadger

该方法似乎用得较少,很少看见使用该方法的文章。

HoneyBadger将单细胞转录组数据计算来推断拷贝数。

缺点:同inferCNV

参考:单细胞测序文献精读|非遗传瘤内异质性可视为肺癌的表型异质性及进化动力的预测因子


四、CopyKAT

原理

估算高通量scRNA-seq基因组拷贝数谱,以区分肿瘤微环境中的正常细胞与恶性肿瘤细胞,识别主要的克隆亚群

优点

不需要正常细胞的,可以自动寻找二倍体细胞作为正常细胞。

弥补了inferCNV、HoneyBadger的缺点

参考:不通过聚类和特定基因marker也可以区分肿瘤细胞和正常细胞—CopyKAT


五、整合正常细胞参考集

原理

肿瘤细胞间的相似性高于与正常细胞的相似性,肿瘤细胞倾向与聚集成簇,非肿瘤细胞倾向于聚集成簇
在这里插入图片描述
难点:

1、对细胞降维聚类resolution的选择需要经验,如果resolution选择太小,容易把一部分真实癌细胞划分为非癌细胞

2、聚集成簇后,如果簇中非癌细胞的比例>0.8(自定义),则认为该簇为非癌细胞簇

两个标准的选择极大的依赖过往经验,没有验证方式

ref:Single-cell multiomic analysis identifies regulatoryprograms in mixed-phenotype acute leukemia

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值