区分癌症细胞和非癌症细胞的方法

最新推荐文章于 2024-07-23 10:45:23 发布

已经变秃何时变强

最新推荐文章于 2024-07-23 10:45:23 发布

阅读量1.8k

点赞数 2

分类专栏：单细胞数据文章标签： r语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51719414/article/details/120279584

版权

单细胞数据专栏收录该内容

1 篇文章 2 订阅

订阅专栏

文章目录

前言
一、聚类或特定基因marker
二、inferCNV
三、HoneyBadger
四、CopyKAT
五、整合正常细胞参考集

前言

单细胞测序取样时由于癌症病灶区域界限不是很清晰和现实技术原因，不可能样本中的每个细胞都是癌症细胞，里面混杂着正常细胞。

有些研究会直接分选需要研究的细胞来保证肿瘤细胞纯度。

而有一些研究是直接将整个样本进行单细胞测序，这种情况下就需要算法推断来区分癌症细胞和非癌症细胞。

区分癌细胞和非癌细胞的理论基础：

非整倍体在人类癌症中很常见 (90%)。具有广泛全基因组拷贝数畸变（非整倍体）的细胞被认为是肿瘤细胞，而基质正常细胞和免疫细胞通常具有 2N 二倍体或接近二倍体的拷贝数分布。

目前已知的区分癌症细胞和非癌细胞的方法有以下几种。

一、聚类或特定基因marker

通过聚类来区分癌细胞和非癌细胞。

通过marker来区分则需要一定的先验知识的准确性，这可能是比较难满足的。

二、inferCNV

1、原理

用来探索肿瘤单细胞转录组数据中体细胞大规模染色体拷贝数变异（如：整个染色体或大片段染色体的获得或缺失）。

用正常细胞作为参考组，和参考组拷贝数变异模式相似的即认定为非癌细胞。

生成的热图表示每条染色体的相对表达强度，同时，因为正常细胞作为比较，能很清楚的知道肿瘤基因组的哪些区域过多或较少。

2、所需文件

基因表达矩阵

meta矩阵

基因位置矩阵

同组织部位的正常细胞作为参考组（一般可以在GTEx网站下载）

3、局限性

不能准确地解析特定染色体断点的基因组位置，也不能根据非整倍体拷贝数谱正确分类肿瘤细胞和正常细胞。

参考：

探索单细胞测序中的恶性肿瘤细胞，一定不能少了它——inferCNV

单细胞转录组鉴定肿瘤细胞：CopyKAT和InferCNV

三、HoneyBadger

该方法似乎用得较少，很少看见使用该方法的文章。

HoneyBadger将单细胞转录组数据计算来推断拷贝数。

缺点：同inferCNV

参考：单细胞测序文献精读|非遗传瘤内异质性可视为肺癌的表型异质性及进化动力的预测因子

四、CopyKAT

原理：

估算高通量scRNA-seq基因组拷贝数谱，以区分肿瘤微环境中的正常细胞与恶性肿瘤细胞，识别主要的克隆亚群

优点：

不需要正常细胞的，可以自动寻找二倍体细胞作为正常细胞。

弥补了inferCNV、HoneyBadger的缺点

参考：不通过聚类和特定基因marker也可以区分肿瘤细胞和正常细胞—CopyKAT

五、整合正常细胞参考集

原理：

肿瘤细胞间的相似性高于与正常细胞的相似性，肿瘤细胞倾向与聚集成簇，非肿瘤细胞倾向于聚集成簇
在这里插入图片描述
难点：

1、对细胞降维聚类resolution的选择需要经验，如果resolution选择太小，容易把一部分真实癌细胞划分为非癌细胞

2、聚集成簇后，如果簇中非癌细胞的比例>0.8（自定义），则认为该簇为非癌细胞簇

两个标准的选择极大的依赖过往经验，没有验证方式

ref：Single-cell multiomic analysis identifies regulatoryprograms in mixed-phenotype acute leukemia

已经变秃何时变强

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
区分癌症细胞和非癌症细胞的方法

文章目录前言一、聚类或特定基因marker二、inferCNV三、HoneyBadger四、CopyKAT前言单细胞测序取样时由于癌症病灶区域界限不是很清晰和现实技术原因，不可能样本中的每个细胞都是癌症细胞，里面混杂着正常细胞。有些研究会直接分选需要研究的细胞来保证肿瘤细胞纯度。而有一些研究是直接将整个样本进行单细胞测序，这种情况下就需要算法推断来区分癌症细胞和非癌症细胞。目前已知的区分癌症细胞和非癌细胞的方法有以下几种。一、聚类或特定基因marker通过聚类来区分癌细胞和非癌细胞。..
复制链接

扫一扫

专栏目录

已经变秃何时变强 CSDN认证博客专家 CSDN认证企业博客

码龄4年

6: 原创

112万+: 周排名

214万+: 总排名

1万+: 访问

: 等级

69: 积分

5: 粉丝

6: 获赞

3: 评论

31: 收藏

私信

关注

热门文章

分类专栏

最新评论

免疫组库vdj的数据处理（TCR/BCR）
小木亘: 您好，感谢您的分享。我最近也在使用TraCeR进行单细胞TCR分析。有两个问题想请教您。1）筛选CDR3序列/TCR的时候，第二个过滤条件我没有文章中看到类似的说法，想请问您是否方便提供这个条件的出处？同时关于TPM卡阈值的问题我似乎只在张泽民老师他们的文章里面看到这个条件。2）我看TraCeR定义克隆是根据V gene加上junction sequence再加上J genes这样去定义的，同时它最后assembly的时候也会输出CDR3的nt/aa信息，我另外还有一批10X数据，想和TraCeR的结果match上，但10X的ouput数据是没有junction sequences这一部分的，想请问在这种情况下，对于10X TCR 数据克隆的定义您有什么建议吗？
机器学习阴性集的选择 —— drug-target interactions （DTIs）
已经变秃何时变强: 你说的其实还是这里举出的第一种方法，也是最开始用的方法。第一种方法里就是把你手上有的药物和靶点集合中验证过存在确实关系的作为阳性集，没有证实存在关系的就作为阴性集，但是这样阴性集就会存在假阴性。所以后面的几种方法就是为了弥补这个缺陷
机器学习阴性集的选择 —— drug-target interactions （DTIs）
Kivsen: 各位大佬，小弟初探生信，一直存在一个问题。如果已知的DTI可以作为正例集那么，如何产生反例集的数据？毕竟我没办法获取到不存在关联的药物靶点对或者说，我无法断言，一对尚未存在关联的药物靶点就一定不存在关系。
机器学习阴性集的选择 —— drug-target interactions （DTIs）
不正经的kimol君: 收获很多，谢谢大佬的分享

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。