单细胞个性化分析之细胞注释篇

追风少年ii

已于 2024-05-17 09:26:59 修改

阅读量1.2k

点赞数 37

文章标签：人工智能数据分析空间转录组单细胞

于 2024-05-17 09:26:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53637133/article/details/138992992

版权

作者，追风少年i

当单细胞基础分析已经完善的时候，摆在眼前首要的问题就是，每个cluster具体是细胞细胞类型？只有在注释了每个群的基础上，才可以进行下游更加深入的个性化分析。细胞注释通常分为三步进行，1）自动注释（可选）、2）手动注释、3）验证。目前已经有了很多的软件和算法来识别细胞类型，但真正落在确定注释的时候，仍然要靠生物学背景和经验的积累。

10X单细胞细胞注释分析策略

单细胞数据自动注释，手动注释和验证的分析测略如下图。

图1 细胞注释分析策略示意图

首先，自动注释目前分两大类，一类是用预定的‘marker gene’（比如：在某一种类型的细胞中表达某一种特定的基因），称之为marker-based annotation。另一类是通过和一些已知的细胞类型比较细胞或cluster的基因表达模式来注释。称之为reference-based或Correlation-based annotation. 其次，自动注释方法具有很大的局限性，结果的确定还是需要人工矫正注释，目前手动注释仍然是细胞注释的金标准；最后，可以使用标记基因、通路分析和具有已知功能信息的差异表达基因的组合进一步手动推断细胞类型。细胞注释通常使用独立来源进行验证，例如新的验证实验，或与互补数据的比较，例如空间转录组学数据。

自动注释

自动注释是一种非常快速的有效的方法，它通过计算机算法或者先前的生物学知识去标记细胞或者细胞cluster。主要的原则就是在单个细胞或细胞cluster中识别与已知细胞类型或状态的特征基因表达信号(模式或信号)相匹配的基因表达信号;然后给细胞或细胞cluster分配相应的标签。标签通常有一个相应的confidence score。自动注释分为两大类，依据“marker gene”，称之为marker-based annotation；另外一种依据参考数据集，称之为reference-based或Correlation-based annotation。基于自动注释有如下特点：

marker-based annotation

marker-based方法一般会涉及到数据库：SCSig，PanglaoDB，CellMarker等都是常用的marker gene数据库。基因表达较低就不适用与marker-based方法。注释成功的关键在于marker gene应该在一个给定的细胞、细胞群或细胞类(例如免疫细胞)中有明确和一致地表达。基础marker注释仍然分为两种，一种是直接注释到cluster，这是自动注释中最常用的注释方法，另外一种是注释到单个细胞，这种方式具有很大的不确定性，但某些情况效果比较好。

基于cluster注释的方法最常见的就是cluster的差异基因匹配细胞“marker”，细胞类型的marker gene可以在现有的数据库中获得，虽然marker gene的数据库已经非常全面，但仍然有一些致命的问题，如下（以Cellmarker数据库为例）：

一、多（冗余）：

1、几乎在任何一个人或小鼠单细胞数据的矩阵里面随便挑选一个基因出来就是一种细胞标志物。

2、同一种组织同一种细胞类型收集到的marker gene多。（以小鼠脑为例，尤其体现在组织细胞）

二、marker gene来源差异：

Single-cell sequencing和Experiment，两种来源的marker gene差异较大，哪种更适合

最低0.47元/天解锁文章

关注

37
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
单细胞个性化分析之细胞注释篇

单细胞个性化分析之细胞注释篇
复制链接

扫一扫

追风少年ii CSDN认证博客专家 CSDN认证企业博客

码龄3年

542: 原创

5334: 周排名

2834: 总排名

33万+: 访问

: 等级

1万+: 积分

5568: 粉丝

7796: 获赞

32: 评论

7698: 收藏

私信

关注

热门文章

最新评论

高精度空间转录组分析之squidpy和空间网络图
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618800987。
python画图设置坐标轴的位置及角度及设置colorbar
浔川python社: 浔川AI翻译即将上线！2024年5月29日（星期三）我们不见不散！
10X空间转录组与卷积神经网络（CNNs）
ha_lydms: 我很喜欢作者的写作风格，总是能够吸引我不断地深入阅读，让我感到非常愉悦和满足。
10X单细胞（10X空间转录组）数据分析之代谢推断篇
qq_57458515: 你好，在使用scFEA的过程中，请问你是否遇到过CUDA out of memory的情况呢。我遇到这种情况之后调整了BATCH_SIZE，但是输出文件只有几个样本有结果，请问您遇到过这样的问题吗。
10X单细胞（10X空间转录组）细胞组成变化分析之scCODA
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。