利用splatter从真实数据估计参数进行RNA数据仿真

@利用splatter从真实数据估计参数进行RNA数据仿真
Splatter是一个模拟单细胞RNA测序计数数据的软件包。它提供了一个简单的界面,用于创建可复制且文档充分的复杂模拟。可以从真实数据估计参数,并提供用于比较真实数据集和模拟数据集的函数。

splatter参数

右侧的试验批次,组数与差异表达参数,丢弃参数的type, 路径参数是不可以通过真实数据进行估计的,我们仿真RNA数据时,可以通过调整这些参数来仿真一定量的仿真数据,来完成我们的消融实验。
在这里插入图片描述
更详细的介绍可以参考这里

代码参考

library(splatter)
library(SingleCellExperiment)
library(scater)
library(readr)
library(Seurat)
set.seed(1)
real_data <- read_csv("你的文件路径")
real_data <- t(real_data)
class(real_data)
# 从真实数据估计参数
params <- splatEstimate(real_data)
params <- setParams(params,update = list(nGenes = 10000))
params <- setParams(params,batchCells = rep(800,1),group.prob=c(0.7, 0.2, 0.1))
params
# 生成模拟数据
sim_data <- splatSimulate(params,verbose = FALSE)
sim_data_1 <- splatSimulateGroups(params, method = "groups",verbose = FALSE)
class(sim_data)
sce_data <- as.matrix(assays(sim_data_1)$counts)
rna_seurat <- CreateSeuratObject(sce_data)
# 进行基于 PCA 的聚类分析
rna_seurat <- FindVariableFeatures(rna_seurat)
rna_seurat <- ScaleData(rna_seurat)
rna_seurat <- RunPCA(rna_seurat)
rna_seurat <- FindNeighbors(rna_seurat)
rna_seurat <- FindClusters(rna_seurat)
# 将聚类结果可视化
DimPlot(rna_seurat, reduction="pca")
#获取数据标签
label <- as.numeric(sim_data@colData@listData$Group)
label <- t(label)
save_file<- as.matrix(assays(sim_data)$counts)
save_file <-t(save_file)
write.table(save_file, file = "你的文件路径", sep = ",", row.names = FALSE, col.names =FALSE,quote = FALSE)
write.table(label, file = "你的文件路径", sep = ",", row.names = FALSE, col.names =FALSE,quote = FALSE)

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

苦笑的背后

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值