#今日论文推荐#华大基因团队开发新的对比学习方法,可快速映射到数百万规模的多模式单细胞图谱
单细胞数据集的规模不断扩大,对处理扩展的规模、扩展的模态和不可避免的批处理效应提出了计算挑战。最近出现了基于深度学习的方法,通过推导非线性单元嵌入来解决这些问题。
华大基因团队展示了细胞表示的对比学习(Contrastive Learning)——Concerto,它利用自我监督的蒸馏框架来模拟多模态单细胞图谱。只需将每个单元与其他单元区分开来,Concerto 就可以适应各种下游任务,例如自动单元类型分类、数据集成,尤其是参考映射。
与当前的主流软件包不同,Concerto 的对比设置很好地支持对所有基因进行操作以保留生物变异。Concerto 可以灵活地推广到多组学以获得统一的细胞表示。
在模拟和真实数据集上的基准测试显示,Concerto 大大优于竞争方法。通过映射到综合参考,Concerto 概括了不同的免疫反应,并发现了 COVID-19 患者的疾病特异性细胞状态。
Concerto 易于并行化和高效扩展,可在 1.5 h 内构建 1000 万个单元格引用,并在 8 s 内查询 10,000 个单元格。总体而言,Concerto 将通过迭代构建单细胞参考图谱并快速映射新的数据集来传输相关的细胞注释,从而促进生物医学研究。
该研究以「Contrastive learning enables rapid mapping to multimodal single-cell atlas of multimillion scale」为题,于 2022 年 8 月 25 日发布在《Nature Machine Intelligence》。
论文题目:Contrastive learning enables rapid mapping to multimodal single-cell atlas of multimillion scale
详细解读:https://www.aminer.cn/research_report/630f67c87cb68b460f109ae5https://www.aminer.cn/research_report/630f67c87cb68b460f109ae5
AMiner链接:https://www.aminer.cn/?f=cs