自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 记录:Mac终端连接远程服务器conda环境,在本地浏览器使用jupyter notebook

jupyter notebook只存在于服务器的某个conda环境里,想在Mac本地浏览器打开使用运行,如何操作?,以cellDancer为例,激活cellDancer环境,用户名前会出现(cellDancer)环境名称,终端-Shell-新建远程连接-ssh-添加服务器地址-输入用户名-连接-输入密码。本地浏览器输入localhost:xxxx(你设置的端口号),即可使用~,跳到文件最后一行,按。

2024-04-12 12:56:58 351

原创 生信新包|GeneTrajectory·单细胞基因轨迹推断

题目:Gene trajectory inference for single-cell data by optimal transport metricsGeneTrajectory 是一种推断单细胞数据中基因轨迹(而不是细胞轨迹)的方法,有助于理解生物过程中的基因动态。GeneTrajectory的主要工作流程:步骤 1. 构建一个单元格到单元格的 kNN 图,其中每个单元格都与其 k 个最近邻单元相连。找到连接图中每对单元格的最短路径,并将其长度表示为单元格之间的图形距离。

2024-04-12 12:56:43 408

原创 生信文献|scINSIGHT·单细胞数据整合

与现有工具相比,scINSIGHT具有以下优点:(1)它能够在考虑单细胞样本的生物学条件的同时整合单细胞样本;(2)它明确地模拟生物条件中常见或特有的协调基因表达模式,从而能够从高维基因表达数据中分解常见和特定条件的基因模块;(3)它使用捕获细胞身份的通用基因模块实现了对单细胞样本中细胞群的精确识别;(4)它能够根据细胞组成和模块表达对样品和生物条件进行有效比较;scINSIGHT 使用基于非负矩阵分解的新模型来学习不同细胞类型和生物条件的基因表达模式。对细胞进行聚类并注释细胞类型或状态。

2024-04-09 13:00:49 341

原创 经验分享|生信数据分析R和python选哪个?

越来越多新的分析方法都是基于python的,建议R有一定基础的(指熟悉基本操作和常见R包的使用)的同学也尝试使用一下python。简单分享一下刚开始需要学习和注意的点(本人也是刚入门,不是专业的……这里需要注意python版本问题,有些包只在特定的python下才能安装运行,具体看每个包的教程,一般来说按照Tutorial安装都会成功。(3)常见报错的解决方法:这个得具体分析了,我遇到的主要问题还是前期环境配置以及使用过程中文件格式的问题。3.python和R的文件转换。1.python的使用。

2024-04-07 11:13:31 298

原创 单细胞|RNA速率下游 · Dynamo

1.将cellDancer的预测输入dynamo。3.学习和可视化 UMAP 上的矢量场。2.将 RNA 速率投影到嵌入空间上。4.Jacobian分析检测基因调控。数据集:cellDancer文件。在UMAP上绘制特定基因的表达。

2024-04-02 14:33:44 264

原创 单细胞 | Seurat文件生成

AllNuclei_snRNA_counts_rownames.txt.gz打开是基因信息(即features.tsv.gz),标准的features文件是两列,包括ensemble ID和symbol,这里只有一列,最简单的方法就是复制一下,变成两列,不然后面用Read10X读取文件会显示报错error in [.data.frame(category.matrix, , gene.group, drop = f) : undefined columns selected。

2024-04-02 13:57:38 196

原创 生信文献|SEACells·推断转录和表观基因组细胞状态

metacell:不同细胞状态的细胞群,代表了高度细化、不同的细胞状态,其中元细胞内的变异是由于技术因素而非生物因素引起的(单细胞细胞状态聚合(SEACells),这是一种基于图的算法,使用核原型分析来计算metacells。证明了SEACells 能够提供对scRNA-seq细胞状态的稳健、全面的特征描述,并且成功地描述了染色质细胞状态,其分辨率能够推断基因表达底层的调控元素。

2024-03-19 18:13:19 347

原创 单细胞 | RNA速率 · cellDancer

cellDancer 的输入数据包含‘gene_name’, ‘unsplice’, ‘splice’ ,‘cellID’ ,‘clusters’ ,‘embedding1’, and ‘embedding2.’。可视化5:展示预测动力学速率(转录α、剪接β和降解速率γ)、剪接 mRNA 丰度和未剪接 mRNA 丰度。3.估计样本的RNA速率:与scVelo不同的是,cellDancer是对。可视化4:显示剪接 RNA 沿伪时间的丰度。可视化2:每个基因的速率分析图。4.可视化1:RNA速率。

2024-02-27 17:22:57 380

原创 单细胞 | RNA速率 · scVelo

1.准备数据:从seurat对象中提取metadata(R中运行)2.运行RNA速率并可视化。

2024-02-16 18:51:05 434

原创 单细胞 | CellChat(二)· 多样本细胞互作

可视化5: 分别查看NL和LS差异较大的通路,从sender、receiver、mediator、influencer比较两组差异细胞类型,并可视化单个配体-受体对。例如:来自特应性皮炎患者的非病变(NL,正常)和病变(LS,患病)人类皮肤,这两个数据集在降维聚类后具有相同的细胞组成。可视化3:查看通路距离,距离越大意味着两个数据集之间的通信网络在功能或结构相似性方面差异越大,可重点关注差异较大的通路。可视化2:根据结构相似性和功能相似性识别信号组,和之前的图类似。二、可视化1:细胞群相互作用数量或强度。

2024-01-29 22:48:33 613

原创 记录:linux下修改jupyter notebook默认目录

2. 到对应文件夹找到配置文件,修改路径,去掉#,搞定!

2024-01-27 23:08:37 181

原创 单细胞 | CellChat(一) · 单样本细胞互作

可视化4:根据结构相似性和功能相似性识别信号组。三.可视化1:celltype之间通讯结果。一.生成cellchat文件,选择数据库。可视化3:计算并可视化网络中心性分数。可视化2:特定信号通路的互作情况。

2024-01-19 11:08:17 527

原创 单细胞 | pySCENIC·转录因子分析(二)

接上一篇,pySCENIC分析完之后就可以进行可视化了,个人认为最重要的有三个图:rss点图,rank图,转录因子表达水平热图,3个图结合着看。3.可视化rank图,可以自己改一下plotRSS_oneSet参数让图更好看一点。4. regulon表达水平热图,转录因子表达水平同理,得到的图类似只是输入不一样。2.可视化点图:寻找cluster特异性转录因子。1.loom文件读入R,提取数据。

2023-12-26 16:34:14 660 1

原创 记录:RStudio Server崩溃解决办法

【代码】记录:RStudio Server崩溃解决办法。

2023-12-07 16:03:45 572

原创 单细胞 | pySCENIC·转录因子分析(一)

SCENIC (Single-Cell rRegulatory Network Inference and Clustering)是一种能够从单细胞 RNA-seq 数据(SCENIC)或单细胞 RNA-seq+单细胞 ATAC-seq 的组合(SCENIC+, 今年新发的Nature Methods, 2023, 20, 1355–1367)中同时进行转录因子推断、基因调控网络重建的方法。3.制作一个trans.py,主要目的是把提取的表达矩阵转成loom文件,python trans.py运行。

2023-12-07 15:07:33 970

原创 单细胞RNA速率

每个时刻未剪接的mRNA 的量都与下一时刻成熟mRNA 的量一致(图e)。昼夜节律相关基因Fgf1在白天高表达,相反,Cbs基因在下午晚上高表达。RNA的表达量,对细胞进行排序,展示的是不同细胞转录水平的相似度,通常需要指定拟时序起点。(基因表达状态的时间导数),展示的是细胞的真实状态,不需要指定起点。的增加,相反,转录的抑制或缺失导致未剪接。的多,可能提示其处于发育相对较早的阶段。对于细胞分化而言,细胞中。浅显的理解:对于一个基因而言,因此,通过将未剪接的。特定基因的转录导致未剪接。

2023-11-08 18:27:18 114 1

原创 单细胞RNA速率(一)| cellDancer

2. cellDancer DNN的关键步骤是定义一个损失函数,并根据每个细胞预测的未来剪接和未剪接mRNA与观察到的邻域细胞之间的相似性来训练DNN;已知:mRNA的转录动力学由转录速率(α)、剪接速率(β)和降解速率(γ)决定,未剪接和剪接mRNA之间的平衡可以预测细胞状态。参考文献:Nature Biotechnology, 2023, 10.1038/s41587-023-01728-5.3. 以单细胞分辨率推断α、β和γ,而不是现有方法(Velocyto、scVelo等)中使用的批量速率。

2023-11-08 18:08:10 246 1

原创 CytoTRACE | 推断拟时序起点

sva/ccaPP/HiClimR/ncdf4这几个包没有的用BiocManager安装一下,安装HiClimR/ncdf4的时候可能会报错(dependency ‘ncdf4’ is not available for package ‘HiClimR’),在linux终端安装netcdf就好了。1. R包下载网站:https://cytotrace.stanford.edu/CytoTRACE_0.3.3.tar.gz。2. 推断拟时序起点,可视化结果储存在本地。

2023-11-01 17:46:40 321 1

原创 单细胞 | Milo · 细胞分布差异

k:分布峰值在 50 到 100 之间,平均邻域大小超过 5 x N_samples。d:用于 KNN 细化的降维数,类似于聚类降维时选择的dims。2. 构建领域,对领域中的细胞计数。3. 定义分组,差异测试。

2023-10-19 10:55:16 283

原创 报错记录:findmarkers:Error in h(simpleError(msg, call))

2.features里的gene在sc里有没有。

2023-10-12 16:05:21 1897 4

原创 tradeSeq | Slingshot下游 沿轨迹分析pathway表达

之前分享了用tradeseq分析沿轨迹变化的基因,可以找到谱系内和谱系间都显著表达的基因,找到这些基因之后,按照常规思路,需要看看这些基因分别是什么,有什么功能,富集到了哪些pathway。其实很简单,把tradeseq的输入文件换成pathway打分矩阵就可以。注意:这里的counts是pathway打分矩阵,nGenes是pathway个数,k自定(后续分析参考之前的文章,出图类似)在GSEA网站上下载自己需要的geneset.gmt文件,也可以自己制作,用AUCell打分。

2023-10-07 14:20:46 404 1

原创 tradeSeq | Slingshot下游 沿轨迹分析基因表达

Tradeseq是一个可以沿着轨迹分析基因表达的R包,也可以用来分析特定pathway沿轨迹的表达,具体方法见后续分享。出的图和上面类似,接下来可以筛选谱系间和谱系内都显著表达的基因,确定每个谱系特异表达的基因。2.拟合负二项式模型确定nknots。

2023-09-06 09:58:44 710 1

原创 报错记录:R安装SCopeLoomR时,hdf5报错

用命令安装一下,接着再重新安装hdf5包就没问题了!

2023-08-25 10:28:17 312 1

原创 Slingshot | 查看单个轨迹

首先还是先运行slingshot,跟之前不同的是,这里建议使用Embeddings提取降维后的坐标信息,而不是sc直接转化为SingleCellExperiment,得到如下图。单个轨迹在sds文件的metadata里,可以看到有4条轨迹,根据拟时序顺序排列好的。也可以提取slingPseudotime,用ggplot2作图,看得更明显一点。可以看到每个轨迹有哪些cluster,按照拟时序顺序由深到浅。1.运行Slingshot。3.提取单个轨迹作图。

2023-08-15 17:08:21 362

原创 Milo | 细胞分布差异

主要原理:先根据KNN方法进行细胞抽样,对抽样后的细胞用KNN找它的邻近细胞,图c里面每个圈代表一个抽样的细胞,圈的大小代表临近细胞数量的多少。细胞之间的连线代表这两个细胞共享多少个邻近细胞,线越粗共享的邻近细胞数量越大,之后检验每个细胞的邻近细胞中来源于不同实验条件的细胞数量是否存在显著差异。显著富集某个条件的细胞就会标那个条件的颜色,最后看在整体UMAP空间上,哪个区域集中有某个条件的颜色,说明这个区域的细胞就在那个条件富集,与那个条件相关。Milo是一个检测细胞分布在不同实验条件下差异的算法(

2023-07-12 12:18:20 564 1

原创 简谈Pseudobulk RNA-seq

Pseudobulk RNA-seq,伪bulk方法

2023-06-06 15:39:36 1456

原创 GSEA | 基因富集分析

GSEA富集分析

2023-04-24 17:14:29 1293

原创 CIBERSORT | 免疫浸润分析R包

CIBERSORT | 免疫浸润分析

2023-04-06 11:35:31 1460 1

原创 Seurat 4.3.0 | 数据集坐标映射

Seurat 4.3.0 | 单细胞数据集坐标映射

2023-03-20 11:03:15 284

原创 Slingshot|单细胞轨迹推断r包

Slingshot:单细胞轨迹推断r包,用于拟时序分析

2023-02-24 09:00:00 2374 2

原创 BayesPrism|反卷积R包的使用方法

BayesPrism 反卷积R包的使用方法

2023-02-22 14:22:52 1939 1

原创 报错记录:Error in grid.Call(C_stringMetric, as.graphicsAnnot(x$label))

Error in grid.Call(C_stringMetric, as.graphicsAnnot(x$label))

2022-11-29 20:11:21 680

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除