DeepTCR论文笔记

TCR特征表示块:将序列先表征到高维空间,使用三层CNN学习提取序列的特征,vdj基因的使用情况作为one-hot表示的分类变量提供给网络,一个可训练的嵌入层再次被用来学习V/D/J基因片段的特征,并将它们从离散的数值空间转换为连续的数值空间然后将这些特征在网络中连接起来,通过其CDR3序列和V/D/J基因的使用提供TCR序列的联合表示,从而允许更完整地表示T细胞受体。然后再进行重构输入改进的TCR表征:包含tcr的序列输入和vdj基因信息的输入

无监督模型:

使用VAE算法,通过TCR特征表示块后得到特征表示后再重构输入

下游任务:

1.通过vae表征以后,使用欧几里得距离,汉明距离,全局序列对其距离

来计算T细胞之间的距离,然后进行聚类,基础真值标签对应于单个序列的特定抗原特异性算法的聚类数量从5到100个聚类变化使用方差比率标准,以及AMI来衡量所有描述的特征化方法的所有聚类解决方案的质量。

  1. 使用knn来 评估各种特征化方法的质量

监督训练:

1.模型1:经过特征提取模块后进行分类任务,标签为对应的特异性抗原

这表明监督学习方法不仅比无监督学习提高TCR序列分类的准确性,还可以揭示决定TCR抗原特异性的关键序列特征

使用了10x Genomics中 57229对α/β TCR与44种特定的pMHC(肽-主要组织相容性复合物)多聚体和6个阴性对照的结合情况进行训练

2.模型2:使用变分自编码器(VAE)和多头注意力机制,来训练一个用于分类TCR(T细胞受体)序列的模型。由于组序列(即TCR库)可能包含大量与特定抗原无关的序列这个过程旨在解决如何从一组TCR序列中识别出对特定抗原有反应的序列的问题。模型的目标是区分那些接触了相应抗原的样本(实验组)与没有接触(对照组)的样本,这有助于确定哪些T细胞反应是针对特定抗原的。

数据来源

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值