单细胞
文章平均质量分 69
TOP生物信息
这个作者很懒,什么都没留下…
展开
-
【单细胞高级绘图】近期代码更新
绘图代码交流群已经成立半年多了,群里的氛围,还算是不错的。通常群里的提问我都会尽量回答;大家对代码有啥建议,我也会优化。针对高级绘图系列中,大家讨论得比较多的几个代码近期进行了更新。原创 2023-06-21 20:00:00 · 728 阅读 · 0 评论 -
【TOP生物信息】基于Scanpy的单细胞数据质控、聚类、标注
「写在前面」Python作为一种高级编程语言,被广泛用于单细胞数据分析,有着以下的优势:「大量的生物信息学库:」 Python拥有大量的生物信息学库,如scikit-learn、scanpy[1]等,可以用于单细胞数据的预处理、聚类、可视化等。「可扩展性:」 Python的开放性和可扩展性使得它可以轻松集成其他的工具和库,例如Jupyter Notebook、PyTorch等,为单细胞研究提供了更多的分析工具和资源。原创 2023-06-18 18:00:00 · 3017 阅读 · 0 评论 -
【TOP生物信息】使用R包Symphony自动注释细胞类型
Symphony 最早发表于 2021 年 Nature Communications 杂志上的一篇文章,文章题目为"Efficient and precise single-cell reference atlas mapping with Symphony"。发表该文章的曾于 2019 年在 Nature Methods 杂志上发表单细胞数据整合算法Harmony。原创 2023-06-04 19:22:17 · 1788 阅读 · 1 评论 -
【TOP生物信息】使用Seurat包自带的方法进行单细胞类型注释
本次推文带来其中一种方法的演示,来自大家已经非常熟悉的Seurat包所自带的单细胞注释方法,该方法首次于2018年发表在Nature Biotechnology,题为《Integrating single-cell transcriptomic data across different conditions, technologies, and species》。原创 2023-05-28 20:00:00 · 2291 阅读 · 0 评论 -
【TOP生物信息】CNS图表复现,单细胞marker基因展示的另一种方式——蜂巢图
Sten Linnarsson大神的单细胞绘图堪称极致美学,在这里,小编选择了发表在nature上展示marker基因的绘图进行复现。原创 2023-05-21 14:30:46 · 2402 阅读 · 0 评论 -
【TOP生物信息】使用SingleR注释细胞类型
SingleR最早发表在2019年Nature Immunology杂志的一篇文章上,文章题目为"Reference-based analysis of lung single-cell sequencing reveals a transitional profibrotic macrophage"。截止至2023年3月10日,引用量已经达到了947。SingleR的基本原理是利用已知类型细胞的基因表达谱和单个细胞的基因表达谱的相关性进行细胞类型鉴定。原创 2023-05-13 20:05:41 · 2771 阅读 · 0 评论 -
答读者问(8):如何批量查询marker基因(对应的蛋白)会不会在膜上表达?
做实验的朋友们对这个问题应该是很感兴趣的,因为涉及到后续能不能实验验证原创 2023-02-12 22:49:06 · 808 阅读 · 1 评论 -
一个对接CellPhoneDB的R包
cellphonedb原创 2023-02-07 18:16:11 · 1506 阅读 · 0 评论 -
CellPhoneDB三个版本(V2、V3、V4)之间的对比
cellphonedb原创 2023-02-07 18:13:09 · 927 阅读 · 0 评论 -
【单细胞高级绘图】11.marker展示_分组气泡图
单细胞转录组中常见的气泡图根据分组信息展开原创 2022-12-22 01:30:52 · 3050 阅读 · 0 评论 -
10套代码让你学会单细胞高级绘图
单细胞高级绘图原创 2023-02-07 18:05:51 · 975 阅读 · 0 评论 -
【单细胞高级绘图】10.KEGG富集结果的圆圈图
本次教程的figure仍然是读者求助的图,算得上是kegg富集图的新流派。据我的调查,该图应该是基迪奥云平台首创(https://www.omicshare.com/tools/Home/Soft/enrich_circle),之后公众号小白鱼的生统笔记进行了复现(仿一个网图,使用circlize包绘制圈图可视化基因集富集分析结果)。最开始也是跟着上述的帖子学习,之后自己对代码进行了改写,重新安排图形的布局,使之(在我看来)更有意义。另一个改动是增加了kegg pathway的注释信息,我在之前的帖子中原创 2022-09-12 17:12:09 · 2897 阅读 · 2 评论 -
【单细胞高级绘图】09.细胞通讯_两组比较_连线图
单细胞转录组细胞通讯分析原创 2022-08-31 01:29:40 · 1516 阅读 · 3 评论 -
【单细胞高级绘图】08.细胞通讯_两组比较_气泡图
细胞通讯分析,我很早之前就写过,当时详细介绍了CellPhoneDB的原理、实操、可视化。单细胞分析实录(18): 基于CellPhoneDB的细胞通讯分析及可视化 (上篇)单细胞分析实录(19): 基于CellPhoneDB的细胞通讯分析及可视化 (下篇)今天说的这个问题还是很常见的:「在进行细胞通讯分析之后,如何比较两组的受配体对的差异?」 如果你的数据包含两个以上的组别,大概率是要做这个事情的。CellPhoneDB这个软件很简单(这也是用得多的原因),在几组数据分别运行之后,是不能直接比较的原创 2022-08-30 20:28:13 · 1872 阅读 · 0 评论 -
【单细胞高级绘图】07.KEGG富集结果展示
这一节画的图是比较新的,图中我用红色箭头标出的是pathway一级注释信息(big annotation,自己想的,非专有名词),纵轴花花绿绿的标注是pathway的二级注释(small annotation)。「如何获取注释」算一个难点,我上一讲也已经讲过:KEGG通路的从属/注释信息如何获取。整个图反映的是有多少基因落到了对应的分类里面。「辩证地看」,整张图都是pathway注释,没有具体的pathway名称,跟平常做的富集分析很不一样。把图里面的二级注释换成具体的pathway会更好。另外,这个.原创 2022-07-25 19:11:21 · 6540 阅读 · 4 评论 -
【单细胞高级绘图】06.feature展示
组合小提琴图原创 2023-02-07 18:01:37 · 884 阅读 · 0 评论 -
05.两组比较_基因集分数添加显著性
今天的图较简单,在展示基因表达以及基因集分数时,较为常见。图中横轴表示细胞类型,并且根据不同组别分开;纵轴表示通路打分。类似的图,之前出过视频教程,样式比上图更多变。B站收藏量也挺高,破千了:跟着Cell Research学单细胞分析:箱型图、小提琴图、误差棒,总有一款适合你获取代码这个系列都会采取限时公开的方式共享代码,24小时内是免费的。超过这个时间如何获取,后台回复2022A可知(可能需要你动动小手转发一下)。代码是从count开始的,即使完全不懂单细胞,也能把图画出来,比较友好,希望对大.原创 2022-05-30 11:14:15 · 550 阅读 · 0 评论 -
04.两组比较_差异基因展示
上一节介绍了两组比较中如何展示差异基因数目,这一节的内容更进了一步,我造了一种图,可以用来表示具体的差异基因。想象一下你的单细胞数据同时包含对照组和实验组,在做完前期的基础分析之后,得到了A B C D等共享的亚群,现在你想知道在A亚群中,实验组和对照组比较有哪些差异基因。类似的场景也可以是你的数据有多个肿瘤患者,每个病人都有配对的原发灶、转移灶,现在想每个病人单独看看原发、转移的差异基因。怎么想到这个图的说到差异基因,火山图大家一定都画过,但是如果有多个亚群、多个病人,那么多张火山图又显得冗.原创 2022-05-05 10:58:14 · 2407 阅读 · 6 评论 -
03.两组比较_差异基因数目展示
接下来两节会介绍两种比较新的图形,可能大多数做单细胞分析的小伙伴没有见过。今天讲的这种图形是用来展示差异基因数目的,比如你的单细胞数据同时包含对照组和实验组,在做完前期的基础分析之后,得到了A B C D等共享的亚群,现在你想知道在A亚群中,实验组和对照组比较有哪些差异基因,差异基因数目是多少。下面这种图就很适合用来展示差异基因数目:这张图是这么看的:左侧图是Arep组相对于Brep组高表达的基因,每一列是一个亚群,每一行是一个基因;基因又分为两个panel,下层panel是unique基因,即.原创 2022-05-05 10:53:01 · 1126 阅读 · 0 评论 -
02.marker展示_堆叠小提琴图
整理了一些旧代码,颜值还不错。我的公粽号有获取方式,除了提供代码,还会提供原始count数据,跟着代码一步一步运行,可以熟悉单细胞转录组基本分析的流程。我也会加入一些自己实际分析中的技巧,希望大家能喜欢这个系列。竖直方向的水平方向的这种图我用很多种方法都画过,目前所采用的代码最灵活...原创 2022-04-27 21:42:59 · 1745 阅读 · 0 评论 -
【代码更新】01.marker展示_聚类和热图组合
之前写了4篇单细胞绘图的进阶代码,反响还不错,每篇都有三四五百人领取代码:01.marker展示_聚类和热图组合02.marker展示_堆叠小提琴图03.两组比较_差异基因数目展示04.两组比较_差异基因展示有一两位读者跟我提了一些小建议(在此表示感谢),比如:代码01加上基因名称(原来没有基因名,因为我设想用AI加会更方便)代码02调整出图的方向(原来为了得到横向的图,需要在pdf阅读器中手动旋转90度)这是代码01更新后的图,还是用的ggplot2及其拓展包打造,没有用pheatm原创 2022-05-30 11:14:48 · 518 阅读 · 0 评论 -
01.marker展示_聚类和热图组合
整理了一些旧代码,颜值还不错。我的公粽号有获取方式,除了提供代码,还会提供原始count数据,跟着代码一步一步运行,可以熟悉单细胞转录组基本分析的流程。我也会加入一些自己实际分析中的技巧,希望大家能喜欢这个系列。这张图分上中下三部分,最上面是各个细胞亚群的层次聚类关系,中间用点的大小来表示亚群细胞数量,最下面是marker基因的表达热图,后面抽空再修改一下,把一些重要基因的label标上去...原创 2022-04-27 21:40:04 · 1014 阅读 · 0 评论 -
Cerebro:一个好用的单细胞数据展示shiny工具
常见的单细胞转录组图形基本都包含,用起来也比较方便,很适合不擅长生信分析的人来做数据探索。对于做分析的人来讲,这样一个网页工具也降低了和非分析合作者的沟通成本。该工具2019年发表在Bioinformatics,文献标题"Cerebro: interactive visualization of scRNA-seq data".具体来讲,Cerebro的功能主要包括:交互式降维结果展示差异基因展示通路富集分析结果展示基因和基因集评分的展示拟时序分析结果展示,用的Monocle2导出图片.原创 2022-03-02 19:51:04 · 1013 阅读 · 0 评论 -
单细胞转录组绘图视频教程
我在B站发布了“单细胞转录组绘图”系列视频教程,一共分了9集,共计57分钟,适合入门single cell和想进阶的小伙伴。1. 数据预处理and肿瘤样本去不去批次(这个图是没有去批次的)2. tsne或者umap降维图的一般画法3. 左下角的坐标轴怎么画其实是用线段代替了坐标轴4. 散点图加等高线加二维密度图nature那篇的绘图还有个大圆圈,最后把它俩组合起来就可以了,后期全靠AI5. 计算基因集分数_投影图6. 热图展示marker基因7. 气泡图展示marker基因原创 2021-11-15 14:12:09 · 1024 阅读 · 0 评论 -
答读者问(7):关于doublet
之前在公粽号发布了几个问题,接下来我会依次给出我的想法,仅供参考。有不同意见的话,欢迎给我发邮件讨论:huangsiyuan1001@163.com问题❝怎么去doublet?挑选出某一大类做小类降维聚类的时候,有人仍然会检查一下各种大类marker的表达情况,这一步是否有必要?❞1最有效的方法还是从上游入手,控制细胞数以及优化测序之前的流程。2不过分析数据的人只能从分析的角度来看了。一般我会「先用软件预测」,可以参考我之前写的一篇帖子:单细胞分析实录(4): doublet检测。这里引原创 2022-07-08 21:31:53 · 337 阅读 · 0 评论 -
答读者问(6):单细胞TPM矩阵如何分析?
之前在平台发布了几个问题,接下来我会依次给出我的想法,仅供参考原创 2022-07-10 18:21:49 · 2249 阅读 · 6 评论 -
答读者问(5):提取monocle2的拟时序/坐标重新画图
之前已经讲过基于monocle2的拟时序分析,感兴趣的小伙伴可以看一下。今天微信群里有人问了这样一个问题:这个图上面的山脊图如何画?这里我给出几种简单的实现方法。还是后台回复20210812获取测试数据和代码。library(monocle)library(tidyverse)library(ggridges)library(RColorBrewer)library(scales)test=readRDS("test_monocle.rds")plotdf=pDat原创 2021-08-12 23:56:12 · 3637 阅读 · 0 评论 -
答读者问(4):inferCNV的几个问题
1.肿瘤细胞太少怎么办?Z: 我的样本是肿瘤原发灶、淋巴结转移灶,我的淋巴结细胞恶性细胞基本都是几十个,这样的话是因为我前期过滤太狠了,还是就是淋巴结里面恶性肿瘤细胞很少?H: 淋巴结转移样本我之前处理过,也是有肿瘤细胞很少的情况,当然也有肿瘤细胞数较多的情况,不能一概而论。你可以试着调整一下过滤参数,再看看。比如线粒体基因占比,肿瘤样本一般高一些。如果最后还是很少,那就没办法了。2.淋巴结里面上皮细胞都是恶性的吗?还是就一部分是恶性。就是计算的CNV来看,会有一部分上皮不是恶性。H: 依据.原创 2021-07-22 20:36:32 · 1395 阅读 · 0 评论 -
答读者问(2):细胞cluster没有聚在一起;去不去批次效应
手动去除doublet是很有必要的一步,别太相信软件。另测序的时候千万别贪多,一个样本细胞数别超过1万,不然doublet可能多得惊人。我问过公司专业人士,一个样本测两万细胞,doublet可能有20%。我在我写的“单细胞分析实录(6): 去除批次效应/整合数据”中提到了这个问题,感兴趣的话可以看一下。因水平有限,有错误的地方,欢迎批评指正!...原创 2021-07-22 16:56:21 · 1508 阅读 · 0 评论 -
答读者问(1):非模式物种找marker;如何根据marker定义细胞类型
下午花了两个小时回答读者的疑问,觉得可以记录下来,也许能帮到一部分人。第一位读者做的是非模式物种的单细胞。一开始以为是想问我非模式物种的marker基因在哪儿找,读者朋友也提到了blast研究的主要细胞类型的marker是有的让读者朋友困惑的是一张表,cluster乘样本的表,每一个值表示表达这个marker基因的细胞数目。这个表其实没有多少信息,且容易给人误导。应该直接从小提琴图看。解答完了这个问题,另一个问题还是回到“非模式物种如何找marker”。找同源基因是一个思路,.原创 2021-07-22 18:17:28 · 787 阅读 · 0 评论 -
【代码更新】单细胞分析实录(21): 非负矩阵分解(NMF)的R代码实现,只需两步,啥图都有
1. 起因之前的代码(单细胞分析实录(17): 非负矩阵分解(NMF)代码演示)没有涉及到python语法,只有4个python命令行,就跟Linux下面的ls grep一样的。然鹅,有几个小伙伴不会命令行,所以我决定再改写一下,把命令行都放到R下面运行。2. 尝试2.1 一开始,我的想法是教大家在R里面调用python,需要提前下载好anaconda和一些python包然而想了想在Windows上安装python包可能对大家不是很友好,有些包很难装,我之前也弄了很久。考虑到这次更新是针对桌面版Rs原创 2021-11-04 14:50:49 · 2817 阅读 · 0 评论 -
【代码更新】单细胞分析实录(20): 将多个样本的CNV定位到染色体臂,并画热图
之前写过三篇和CNV相关的帖子,如果你做肿瘤单细胞转录组,大概率看过:单细胞分析实录(11): inferCNV的基本用法单细胞分析实录(12): 如何推断肿瘤细胞单细胞分析实录(13): inferCNV结合UPhyloplot2分析肿瘤进化其中,第三篇帖子里面有两个注释代码,可以在基因和染色体长短臂两个层面对CNV做注释这次对tree_anno.R代码做了更新,简单来说就是对原始CNV region的长度做了限制,最后的结果会输出更少更明显的CNV之前在我这里拿过代码的读者如果需要,可以原创 2021-10-30 13:16:17 · 2010 阅读 · 0 评论 -
单细胞分析实录(19): 基于CellPhoneDB的细胞通讯分析及可视化 (下篇)
在上一篇帖子中,我介绍了CellPhoneDB的原理、实际操作,以及一些值得注意的地方。这一篇继续细胞通讯分析的可视化。公众号后台回复20210723获取本次演示的测试数据,以及主要的可视化代码。所有的数据和结果文件均已打包,下载后直接就能跑下面的代码画图。下面的代码可以绘制对称热图(如果你不清楚为啥热图要沿着对角线对称,可以看一下之前的推文)library(tidyverse)library(RColorBrewer)library(scales)pvalues=read.table原创 2021-07-24 17:30:16 · 4953 阅读 · 11 评论 -
单细胞分析实录(18): 基于CellPhoneDB的细胞通讯分析及可视化 (上篇)
细胞通讯分析可以给我们一些细胞类群之间相互调控/交流的信息,这种细胞之间的调控主要是通过受配体结合,传递信号来实现的。不同的分化、疾病过程,可能存在特异的细胞通讯关系,因此阐明这些通讯关系至关重要。CellPhoneDB配有详实的受配体数据库,其整合了此前的公共数据库,还会手动矫正,以得到更加准确的受配体注释。此外,针对受配体有多个亚基的情况,也进行了注释。下面这张图显示了CellPhoneDB配有的数据库包含多少种分泌蛋白和膜蛋白、蛋白质复合物、受配体关系,以及它们来源于什么数据库。1. CellP原创 2021-07-24 16:53:41 · 11118 阅读 · 3 评论 -
单细胞分析实录(17): 非负矩阵分解(NMF)代码演示
本次演示使用的数据来自2017年发表于Cell的头颈鳞癌单细胞文章:Single-Cell Transcriptomic Analysis of Primary and Metastatic Tumor Ecosystems in Head and Neck Cancer。本次演示提供处理好的测试数据,以及所有代码,一共6个脚本(我目前写得最详细的教程,也是全网少有的)。数据的预处理就不演示了,预处理的代码存放在0.pre.R文件中。以下是肿瘤细胞tsne图和原图的对比,和原文一致,说明前面的数据提.原创 2021-07-23 10:10:55 · 2051 阅读 · 0 评论 -
单细胞分析实录(16): 非负矩阵分解(NMF)检测细胞异质性
相信做过肿瘤单细胞的小伙伴对这个分析并不陌生,如果多读几篇文献,就能在CNS以及大子刊上面看到这个分析。非负矩阵分解(Nonnegative Matrix Factorization,NMF)是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法。基本思想:给定一个非负矩阵V, NMF能够找到一个非负矩阵W和一个非负矩阵H, 使得矩阵W和H的乘积近似等于矩阵V中的值。放在我们单细胞转录组的场景下,就是需要将一个基因×细胞的表达矩阵(V),分解成基因×表达程序(W),与表达程序×细胞(H)两个矩阵的原创 2021-06-25 20:08:00 · 4958 阅读 · 0 评论 -
单细胞分析实录(15): 基于monocle2的拟时序分析
关于什么是“拟时序分析”,可以参考本期推送的另一篇推文。这一篇直接演示代码monocle2这个软件用得太多了,很多文章都是monocle2的图。因为只使用表达矩阵作为输入,相比于其他软件,已经很方便了。不过话说回来,我总感觉这种轨迹推断像玄学,大半的结果是调整出来的/事先已知的,比如拟时序里面的起始状态经常需要自己指定。在做拟时序之前,最好先跑完seurat标准流程,并注释好细胞类型。我这里使用的数据都已经注释好细胞类型,并且事先已经知道哪一个细胞类型可能是初始状态。1. 导入数据,创建对象,预处.原创 2021-06-06 17:11:24 · 17822 阅读 · 5 评论 -
单细胞分析实录(14): 细胞类型注释的另一种思路 — CellID
之前写过一篇细胞类型注释的推文:单细胞分析实录(7): 差异表达分析/细胞类型注释,里面介绍了细胞类型注释的两种思路。在谈到自动注释时,我们基本都会用SingleR这个软件,类似的软件还有很多,原理上可能五花八门,但表现不一定有SingleR好。很多软件在做注释时会基于某个细胞和参考细胞表达谱的相似性,今天看到的这个软件使用的是另一种思路:将某个细胞的特征基因集与表征细胞类型的参考基因集做富集分析,当在某个细胞类型的基因集上显著富集时,就定义为这个细胞类型(和GO富集很像)。所以这种方法的关键点是:找单个细原创 2021-05-27 23:13:31 · 2922 阅读 · 0 评论 -
单细胞分析实录(13): inferCNV结合UPhyloplot2分析肿瘤进化
这一个分析,我目前只在Nature Communications上面看到过两篇文章,都是2020年发表的。肿瘤进化是单细胞里面做肿瘤内部异质性一个比较创新的角度,我参与的课题中也用到了这个分析。公众号后台回复20210420获取今天的数据和部分代码。1. 先来看一下例子Single-cell analysis reveals new evolutionary complexity in uveal melanoma这个图并不复杂,单独看每一个样本的进化树,上方主干对应的CNV事件,是早期就发生的.原创 2021-04-20 23:27:31 · 4751 阅读 · 6 评论 -
单细胞分析实录(12): 如何推断肿瘤细胞
公众号后台回复20210418,获取本文的测试数据1. 回顾前面我已经讲解了inferCNV的基本用法,这一节继续学习:如何推断肿瘤细胞。本文应该是到目前为止,全网最详细的帖子(之一)。关于肿瘤细胞的推断,比如研究上皮细胞起源的肿瘤,我见过的一些做法如下简单粗暴型:将来源肿瘤病灶的所有上皮细胞都看成是肿瘤细胞看CNV:将来源于肿瘤病灶的上皮细胞和参考细胞比较,将那些有明显CNV的细胞看作肿瘤细胞看表达特征:考虑到有的肿瘤细胞可能没有CNV层面的变化,有的文章会根据肿瘤与正常的表达谱来区分是.原创 2021-04-18 22:19:45 · 7880 阅读 · 7 评论