自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 资源 (2)
  • 收藏
  • 关注

原创 如何选择合适的假设检验方法

不同假设检验方法的适用性分析

2024-09-04 11:15:52 988

原创 R-建模(广义)线性(加性、混合)模型

利用R语言建模(广义)线性(加性、混合)模型

2024-09-04 11:13:17 912

原创 Seurat v4 与 v5 数据整合工作流的技术差异说明

随着近年来 Seurat 团队的不断更新,该分析框架已经发展到了 v5 版本。相较于之前的版本,Seurat v5 在数据结构和分析方法上都进行了许多重要的调整和改进。本帖收集了一些资料特别对新旧版本的数据整合工作流之间的一些差异进行了汇总。

2024-09-04 11:11:32 1006

原创 Seurat 与 Leiden 算法的无缝集成:对比 Louvain 效率测试

本文记录了在Win10系统在Rstudio平台中使用 reticulate 为 Seurat::FindClusters 链接Python 环境下的 Leidenalg 算法进行聚类的实现过程 ,并探讨了在Seurat和Scanpy流程框架下,Louvain和Leiden算法在处理10万细胞样本量的表达谱矩阵时的速度表现。

2024-09-04 11:09:51 999

原创 RunPrestoAll:Seurat差异基因分析加速利器!

差异基因表达分析旨在识别不同细胞群体之间的基因表达水平差异,从而揭示细胞群体之间的功能和特征。Seurat 提供了一个 FindAllMarkers 方法用于在单细胞RNA测序数据中寻找差异表达基因。然而,对于大型数据集的DE分析,使用Seurat软件包的FindAllMarkers方法 在数据集的全部细胞上执行DE搜索将变得非常缓慢。本文评测了不同DE搜索方法的速度与可靠性。

2024-09-04 11:08:48 1024

原创 Spateo基于SSDNA圈细胞操作指南

Spateo 提供了创新性方法来使用细胞核染色图像或 RNA 信号来实现单细胞分割。当使用高分辨率空间转录组学分析时,例如 BGI 的 Stereo-seq,每个细胞都被许多像素格捕获(对于 Stereo-seq,大约 400 个)。这使我们能够从相邻的像素格聚合 UMI 以执行单细胞分割,最终产生细胞 x 基因的RNA表达矩阵,就像单细胞 RNA-seq (scRNA-seq) 分析一样。...

2022-08-04 16:12:27 1683 2

原创 Spateo进行bin50空间转录组数据分析

spateo 软件BIN50数据分析流程指南

2022-08-04 15:37:06 3748 5

原创 Spateo软件安装记录

spateo 空间转录组时空建模软件在线和离线安装教程

2022-08-04 15:04:31 1646

原创 Linux下conda环境安装指定版本GCC编译器编译phylocom-4.2软件记录

Linux下conda环境配置不同的版本GCC编译器套件,gcc编译器版本问题导致的-fno-plt参数异常解决,gcc库缺失问题"cannot find -lgcc_s"解决。

2022-07-20 22:05:30 3632

原创 ggplot-geom_point 散点图添加聚类标签

本篇分享在ggplot的散点聚类图中,为每个类群添加标签Label的方法,方法通过kmeans方法计算每个簇的中心,给每个簇的中心点添加Class_label实现每个簇的标签标记。

2022-07-07 18:19:39 1693

原创 R语言-data.table包用来加速大型数据集的加载和运算

R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点是快。它内部处理的步骤进行了程序上的优化,使用多线程,还有很多C编写的函数,大大加快数据运行速度。尤其当对一两百万甚至更大数据集进行修改或运算时,由于data.table直接对数据本身做运算,不创建副本,因此相较于基本的data.frame格式,data.table在面对大型数据集时,进行聚合排序以及分组运算的性能非常高 !............

2022-07-07 00:48:49 1608

原创 从稀疏矩阵构建adata对象

python从稀疏矩阵构建adata对象

2022-07-01 22:24:03 735

原创 conda 写出环境yaml配置文件用于新设备部署环境

conda 写出环境yaml配置文件用于新设备部署环境

2022-07-01 22:22:47 719

原创 Seurat对象数据结构整理-1

Seurat对象数据结构整理-1

2022-07-01 22:21:49 7199

原创 Linux 下用R语言打开hdf5(.h5)文件异常的解决方案

Error in H5File.open(filename, mode, file_create_pl, file_access_pl) :

2022-07-01 22:18:08 3543

原创 R语言apply()族函数概要,用来替代经典循环结构提高遍历效率

R语言apply()族函数概要,用来替代经典循环结构提高遍历效率

2022-07-01 22:14:37 738

原创 scanpy合并多个adata数据集和根据条件进行随机抽取细胞

scanpy合并adata数据和根据条件进行随机抽取细胞

2022-07-01 22:14:03 1509

原创 R、python、shell语言下的目录文件的搜索 增删查操作

R、python、shell语言下的目录文件的搜索 增删查操作

2022-07-01 22:09:26 256

原创 差异基因通路富集分析的统计学假设

单细胞转录谱可以根据基因表达水平进行差异分析,通过差异分析,我们可以知道不同分群之间是否存在差异,以及存在显著表达量差异的基因集(DEG,在单细胞Seurat分析流程中,通过Seurat::FindAllMarkers()方法计算得到簇间的过表达差异基因)。进一步,探究这些DEG是由哪些生物学过程介导的,我们的实验处理影响了哪些生物学过程。理解这些DEG所代表的生物学意义的最佳途径就是基因富集分析(Gene Set Enrichment Analysis, GSEA)。...

2022-06-29 21:39:05 1171

原创 R语言-超大型数据框与稀疏矩阵的切片-处理as.matrix方法的“problem too large”异常

R语言-超大型数据框与稀疏矩阵的切片-处理as.matrix方法的“problem too large”异常

2022-06-27 18:41:17 803

原创 R语言组合多个向量Vector为数据框

R语言组合多个向量Vector为数据框

2022-06-26 13:15:39 1890

原创 R语言创建空数据框(Empty Data Frame )用于追加数据

R语言创建空数据框(Empty Data Frame )用于追加数据

2022-06-26 13:14:57 10081

原创 dplyr-as.numeric保留行名转换数据框(矩阵)的所有字符型列向量为数值型

dplyr-as.numeric保留行名转换数据框(矩阵)的所有字符型列向量为数值型

2022-06-26 13:14:06 4305 1

原创 dplyr-distinct 行记录去重细节处理

dplyr-distinct 行记录去重细节处理

2022-06-26 13:13:22 1079

原创 dplyr-select 根据条件选择列向量

dplyr-mutate-across 选择多列应用函数示例

2022-06-26 13:12:25 476

原创 dplyr-summarise 数据分组进行统计描述

dplyr-summarise 数据分组进行统计描述

2022-06-25 15:30:43 758

原创 plyr::ldply-列表[list]转换数据框[data.frame]

plyr::ldply-列表[list]转换数据框[data.frame]

2022-06-25 15:29:54 462

原创 按小数点(英文句号)“.“(dot)分割字符串

R语言字符分割-按小数点(英文句号)"."(dot)分割字符串的转义处理

2022-06-25 15:29:01 610

原创 dplyr-aggregate数据框聚合

dplyr-aggregate对数据框进行行或列的简单聚合处理

2022-06-25 15:27:39 123

原创 R语言字符串字符的大小写转换

R语言字符串大小写转换

2022-06-25 15:25:47 2036

原创 R语言数据表三元组(长数据)格式与宽数据格式转换

R语言数据表三元组(长数据)格式与宽数据格式转换

2022-06-25 15:22:05 880

原创 dplyr-grep对数据框进行全局行过滤

dplyr-grep对数据框进行全局行过滤

2022-06-25 15:20:56 200

原创 dplyr-gsub配合使用替换全数据框的值

dplyr-gsub配合使用替换全数据框的值

2022-06-25 15:20:02 318

原创 dplyr-tibble转换数据框的行名与列向量

dplyr-tibble转换数据框的行名与列向量

2022-06-25 15:18:26 946

原创 dplyr-tidyr-drop_na去除包含空值的行

dplyr-tidyr-drop_na方法去除数据框中包含空值的行

2022-06-25 15:16:54 1029

原创 R语言-聚合合并(aggregate)存在重名且维度不相同的N个数据框-两种实现方法

在单细胞转录组学数据分析中,我们经常需要对表达谱进行拟细胞或拟基因方向的分析,这些分析涉及到对表达矩阵的聚合汇总处理,同时还需要兼顾快速处理这些大型数据集。本文分享两种方法,实现对存在同名的行和同名的列,且维度不等的多个数据表进行快速聚合合并...

2022-06-23 23:58:44 1019

原创 R语言rhdf5读写hdf5文件(.h5)展示文件组织结构和数据索引

在一些单细胞文献中,作者通常会将分析的数据上传到GEO数据库保存为.h5格式文件,而不是我们常见的工程文件(rds文件,表格数据等),为了解析利用这些数据需要对hdf5格式的组织结构有一定的了解。...

2022-06-23 00:13:24 8580

原创 Linux 转换 find 命令的返回结果为 shell array

Linux 转换 find 命令的返回结果为 shell array

2022-06-21 18:14:00 2259 1

原创 Seurat::DotPlot绘图美化-facet方法添加X轴注释标签

R语言ggplot2气泡图美化样式-facet方法添加X轴注释标签,以及添加聚类树的实现方法记录

2022-06-18 00:21:37 4255 1

原创 R语言-稀疏矩阵对象格式学习-重点理解稀疏矩阵对象的重构

在单细胞领域,稀疏矩阵对于处理 scRNA-seq 表达谱数据是非常必要的,构建分析对象的时候它们消耗更低的内存。本文重点介绍 R语言 稀疏矩阵对象格式,稀疏矩阵的重构, 稀疏矩阵与稠密矩阵的相互转换。...

2022-06-18 00:05:16 1927

人类GRCh38第14修订版基因注释与食蟹猕猴的同源基因信息参考

该文件是从Ensemble网站下载的人类GRCh38第14修订版基因注释与食蟹猕猴的同源基因信息参考

2024-07-23

R语言软件包 SNPlocs.Hsapiens.dbSNP144.GRCh37

SNPlocs.Hsapiens.dbSNP144.GRCh37 提供了人类基因组版本GRCh37的单核苷酸多态性(Single Nucleotide Polymorphism,SNP)的位置信息。该软件包基于dbSNP144数据库,提供了SNP的染色体位置、起始和终止位置、参考等基本信息。

2023-11-14

Linux_Miniconda_x86

python环境管理工具,conda最新版本包

2022-07-29

spateo 离线安装包

空间转录组学的时空建模软件spateo ,通过将dynamo全局调用 改为局部调用,修复导入spateo 自动打开ipython的异常问题,修复空间marker计算函数。软件源来自`https://github.com/aristoteleo/spateo-release`;

2022-07-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除