写在前面
此前我们在生信基地举办了生信基地第一课| 1.5天学会单细胞分析的交流活动,经过1.5d的学习,我们布置了如下文献结果复现作业,代码复现可见《NC》代码复现| scRNA-seq揭示人纤维化皮肤病中的成纤维细胞异质性和间充质成纤维细胞增加:
文章标题:Single-cell RNA-seq reveals fibroblast heterogeneity and increased mesenchymal fibroblasts in human fibrotic skin diseases
文章中文标题:单细胞 RNA-seq 揭示了人纤维化皮肤病中的成纤维细胞异质性和间充质成纤维细胞增加
发表期刊:《Nature Communications》
1、如下图的展示 进行大群聚类注释(图b)、各细胞类型占比分布(图f)、各细胞类型高表达基因热图(图d)各细胞类型marker基因的featureplot图(图e)。
2、对成纤维细胞亚群进行重新聚类(图a)、每个样本的细胞亚型的数量占比(图c)、展示每个样本的umap降维图(图b)、做下列图中基因的小提琴图(图g)(小提琴可分开展示)。
3、 高级分析细胞通讯 展示不同分组的各细胞类型的细胞通讯数量热图;
复现结果
学完了1.5d的课程后,这位同学已经可以输出以下内容啦,其实很多复现的内容相差无几,甚至图片要比原文更加美观~
复现流程:
1. 导入数据,初始化
2. 参数过滤
-
过滤基因:min.cells =3 过滤基因。
-
过滤细胞:umi.range = 200~35000,feature.range = 100~6500, 线粒体相关基因:Mitorelatedgenes基因集(17) ,使用MAD方法进行过滤。
过滤后数据如下:
对NF1的count重新过滤(503~ 25973):
3. 整合数据
使用vst方法寻找高变基因(数目2000),整合方法采用Harmony。
4. 聚类 以三种阈值对数据进行测试,最终得出分辨率:0.5,PCA维数15符合原文章。
5. 注释 Marker Gene (原文获取总结)
分群图:
详细featureplot:
ENDO: 1.5.6群定义为ENDO, 分别为ENDO_1, ENDO_2, ENDO_3。
FIB: 0.4.7.15 群定义为 FIB,分别为FIB_1, FIB_2, FIB_3, FIB_4。
SMC: 2.12群定义为SMC,分别为SMC_1, SMC_2。
KRT: 3.8.13.18.19 群定义为KRT,分别为KRT_1, KRT_2, KRT_3, KRT_4。
IMM:9群定义为IMM。
LYME:11群定义为LYME。
NEU:14群定义为NEU。
SGC:20群定义为SGC。
MELA:14群定义为MELA。
根据上图 Marker 可以看出 14 群有明显的分离,但是并没有很好的分成两群。无 法对MELA和NEU进行分类。对比原文,证明分群参数不够合理。进行调整后,分辨率保持0.5,PCA20可以得到很好的分离。由于原本流程中已经 进行了PCA20的聚类,故继续使用。
不再重复展示上述辅助定位的流程,详细分群有差异:21 群增至 23群(0-22) (这里的分离参数和分群不一致有多种可能,包括平台和原文作者使用的聚类方 法,不同人不同次分析也会存在差异,主要目的是尽可能复现原文的分群,允许 存在一定范围内的数据漂移。)
修正后降维图(23clusters):
大群细分结果:
细节注释结果:
大群结果
6. 大群可视化
通过对比原文图和复现图,基本符合比例(此处选择个人喜欢的颜色,颜色偏浅,仅 作展示;在正式发文时应注意考虑色弱,和红绿色盲)
Feature Plot
Heatmap(右侧注释为AI手动添加)
7. 亚群细分(FIB组)
8. FIB_subtype 细胞注释
Marker gene
降维注释图
分样本降维UMAP
9. 高级分析-细胞通讯(Cellphonedb) 首先合并大群和亚群的celltype(在辅助信息中的添加标签,通过合并meta.data数据实 现合并),随后则可在一个数据中对亚群和大群进行细胞通讯分析。分为normal scar & keloid 两组分别对细胞通讯的数量进行热图展示 通讯结果:
原文通讯结果:
原文中的细胞通讯结果显示出在疤痕状态中有更多的mesenchymal_fib,ecretory_papillary_fib,secretory_reticular_fib间的通讯。
在本次的分析结果中也表现了相对一致的结果:
Seeksoul 单细胞平台使用感受
整体都很方便快捷,相对本地进行代码编辑和图文修改有很大优势。为 R 语言等 零基础的科研人员提供了更好的分析平台。据我所知,做单细胞全长分析的公司也有几家,但能够提供如此技术支持和指导的并无一二。后续本人课题也会优先选择 Seeksoul进行合作。但在使用过程中仍有一些不足(仅根据个人使用体验进行阐述):
-
在培训和使用过程中发现许多未接触过生信技术的临床医生,医药专业类学生都无 法快速上手平台的使用。并且大部分知识对于大部分人来说进行网上检索也不是一件易事。建议在针对平台使用的客户新开辟一个简短的基础教学模块,提前录制好 相关操作和知识的短视频,嵌入在平台网页或相关程序中,可以更高效地解决客户 的基础问题(在某个角度上,人工在群里答疑也并非易事,因为每个人的水平,乃 至理解能力都有很大的偏差,如果能够优先观看相关知识讲解也许可以解决大多数 问题)。
-
在有些分析模块中,出图个性化设置可以再拓展一些,也许大多数人对于文章发表 没有很高的美化要求;但是至少我,或者说我的同门都更加偏好对于文章图片进行 二次优化。在平台如果可以一次性进行更多样的调整将会更好。、
-
在上传自有数据时(已整合数据)发现要求需要 tsne/umap 两种降维结果,但大多 数人只选择了一个方法进行降维。
-
如果可以针对意向用户下发短期多样本体验权限将会更好帮助客户进行操作的理解。因为没有使用过平台的客户也需要摸索调试方法,用R进行分析的客户在平台进行 分析时也会因为方式方法不同产生疑惑。
最后,感谢Biomamba,师兄带领Biomamba生信基地联合Seeksoul寻因生物,提供学习分析平台的机会,以及在培训过程中的耐心解惑。希望 Biomamba生信 基地和寻因生物做大做强,越来越好!
视频教程
本系列视频我们将进行拆解动作,完整视频教程可见合集:
总是有小伙伴在学我们的单细胞代码教程(两百篇单细胞知识帖)时深感头疼,密密麻麻的代码、繁琐的流程、巨大的数据量,这些都是劝退大家的门槛。这对这一现象,Biomamba联合寻因生物发布了科研利器——SeekSoul Online单细胞云平台及对应的《2周教你学会单细胞生信全套分析》课程,准备好零代码发单细胞文章吧!
云平台访问链接:https://seeksoul.online/t_static/Biomamba/Biomamba.html
往期云平台使用视频教程可参考:单细胞云平台教程全收录
体验反馈问卷链接:https://www.wjx.cn/vm/QIX0xRI.aspx#