cytotrace有网页端和R包。
web端分析,分为单个dataset和多个需要整合的dataset.单样本主要用CytoTRACE功能,多样本、多batch、甚至10x和smart-seq2这种不同平台的,用conbat进行批次效应去除。
对于前者(单样本)需要:
1,表达矩阵,首行为细胞名,首列为基因名。不要pre filter genes,也不要normalization(但是log2,TPM可以,只要表达量不要出现负值就行)
A1那格可以瞎填一个
2,phenotype table。第一列是细胞id,与表达矩阵相对应。第二列是cell label。注意此表不要包括headers
对于后者(多个样本),每个dataset各自准备好上述两个文件即可,多余5个dataset只能用R包分析。
代码版:
不少单细胞的包本身集成了python模块的机器学习,学好R reticulate包可以无痛安装这些包