- 博客(45)
- 资源 (2)
- 收藏
- 关注
原创 Seurat v4 与 v5 数据整合工作流的技术差异说明
随着近年来 Seurat 团队的不断更新,该分析框架已经发展到了 v5 版本。相较于之前的版本,Seurat v5 在数据结构和分析方法上都进行了许多重要的调整和改进。本帖收集了一些资料特别对新旧版本的数据整合工作流之间的一些差异进行了汇总。
2024-09-04 11:11:32 1006
原创 Seurat 与 Leiden 算法的无缝集成:对比 Louvain 效率测试
本文记录了在Win10系统在Rstudio平台中使用 reticulate 为 Seurat::FindClusters 链接Python 环境下的 Leidenalg 算法进行聚类的实现过程 ,并探讨了在Seurat和Scanpy流程框架下,Louvain和Leiden算法在处理10万细胞样本量的表达谱矩阵时的速度表现。
2024-09-04 11:09:51 999
原创 RunPrestoAll:Seurat差异基因分析加速利器!
差异基因表达分析旨在识别不同细胞群体之间的基因表达水平差异,从而揭示细胞群体之间的功能和特征。Seurat 提供了一个 FindAllMarkers 方法用于在单细胞RNA测序数据中寻找差异表达基因。然而,对于大型数据集的DE分析,使用Seurat软件包的FindAllMarkers方法 在数据集的全部细胞上执行DE搜索将变得非常缓慢。本文评测了不同DE搜索方法的速度与可靠性。
2024-09-04 11:08:48 1024
原创 Spateo基于SSDNA圈细胞操作指南
Spateo 提供了创新性方法来使用细胞核染色图像或 RNA 信号来实现单细胞分割。当使用高分辨率空间转录组学分析时,例如 BGI 的 Stereo-seq,每个细胞都被许多像素格捕获(对于 Stereo-seq,大约 400 个)。这使我们能够从相邻的像素格聚合 UMI 以执行单细胞分割,最终产生细胞 x 基因的RNA表达矩阵,就像单细胞 RNA-seq (scRNA-seq) 分析一样。...
2022-08-04 16:12:27 1683 2
原创 Linux下conda环境安装指定版本GCC编译器编译phylocom-4.2软件记录
Linux下conda环境配置不同的版本GCC编译器套件,gcc编译器版本问题导致的-fno-plt参数异常解决,gcc库缺失问题"cannot find -lgcc_s"解决。
2022-07-20 22:05:30 3632
原创 ggplot-geom_point 散点图添加聚类标签
本篇分享在ggplot的散点聚类图中,为每个类群添加标签Label的方法,方法通过kmeans方法计算每个簇的中心,给每个簇的中心点添加Class_label实现每个簇的标签标记。
2022-07-07 18:19:39 1693
原创 R语言-data.table包用来加速大型数据集的加载和运算
R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点是快。它内部处理的步骤进行了程序上的优化,使用多线程,还有很多C编写的函数,大大加快数据运行速度。尤其当对一两百万甚至更大数据集进行修改或运算时,由于data.table直接对数据本身做运算,不创建副本,因此相较于基本的data.frame格式,data.table在面对大型数据集时,进行聚合排序以及分组运算的性能非常高 !............
2022-07-07 00:48:49 1608
原创 Linux 下用R语言打开hdf5(.h5)文件异常的解决方案
Error in H5File.open(filename, mode, file_create_pl, file_access_pl) :
2022-07-01 22:18:08 3543
原创 差异基因通路富集分析的统计学假设
单细胞转录谱可以根据基因表达水平进行差异分析,通过差异分析,我们可以知道不同分群之间是否存在差异,以及存在显著表达量差异的基因集(DEG,在单细胞Seurat分析流程中,通过Seurat::FindAllMarkers()方法计算得到簇间的过表达差异基因)。进一步,探究这些DEG是由哪些生物学过程介导的,我们的实验处理影响了哪些生物学过程。理解这些DEG所代表的生物学意义的最佳途径就是基因富集分析(Gene Set Enrichment Analysis, GSEA)。...
2022-06-29 21:39:05 1171
原创 R语言-超大型数据框与稀疏矩阵的切片-处理as.matrix方法的“problem too large”异常
R语言-超大型数据框与稀疏矩阵的切片-处理as.matrix方法的“problem too large”异常
2022-06-27 18:41:17 803
原创 dplyr-as.numeric保留行名转换数据框(矩阵)的所有字符型列向量为数值型
dplyr-as.numeric保留行名转换数据框(矩阵)的所有字符型列向量为数值型
2022-06-26 13:14:06 4305 1
原创 plyr::ldply-列表[list]转换数据框[data.frame]
plyr::ldply-列表[list]转换数据框[data.frame]
2022-06-25 15:29:54 462
原创 R语言-聚合合并(aggregate)存在重名且维度不相同的N个数据框-两种实现方法
在单细胞转录组学数据分析中,我们经常需要对表达谱进行拟细胞或拟基因方向的分析,这些分析涉及到对表达矩阵的聚合汇总处理,同时还需要兼顾快速处理这些大型数据集。本文分享两种方法,实现对存在同名的行和同名的列,且维度不等的多个数据表进行快速聚合合并...
2022-06-23 23:58:44 1019
原创 R语言rhdf5读写hdf5文件(.h5)展示文件组织结构和数据索引
在一些单细胞文献中,作者通常会将分析的数据上传到GEO数据库保存为.h5格式文件,而不是我们常见的工程文件(rds文件,表格数据等),为了解析利用这些数据需要对hdf5格式的组织结构有一定的了解。...
2022-06-23 00:13:24 8580
原创 Seurat::DotPlot绘图美化-facet方法添加X轴注释标签
R语言ggplot2气泡图美化样式-facet方法添加X轴注释标签,以及添加聚类树的实现方法记录
2022-06-18 00:21:37 4255 1
原创 R语言-稀疏矩阵对象格式学习-重点理解稀疏矩阵对象的重构
在单细胞领域,稀疏矩阵对于处理 scRNA-seq 表达谱数据是非常必要的,构建分析对象的时候它们消耗更低的内存。本文重点介绍 R语言 稀疏矩阵对象格式,稀疏矩阵的重构, 稀疏矩阵与稠密矩阵的相互转换。...
2022-06-18 00:05:16 1927
R语言软件包 SNPlocs.Hsapiens.dbSNP144.GRCh37
2023-11-14
spateo 离线安装包
2022-07-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人