单细胞测序分析（4）——Seurat（3.0）包学习笔记

最新推荐文章于 2024-08-13 16:57:02 发布

leo12354

最新推荐文章于 2024-08-13 16:57:02 发布

阅读量9.7k

点赞数 4

分类专栏：生信分析

本文链接：https://blog.csdn.net/leo12354/article/details/108698568

版权

这篇博客记录了作者学习单细胞测序分析工具Seurat（3.0）的过程，包括从下载表达矩阵数据到在RStudio中的操作步骤。作者参照了相关学习资料，并尝试进行数据分析，遇到问题并在解决中。同时，作者设想到将fastq文件转化为表达矩阵以直接分析测序数据，并计划后续研究。

摘要由CSDN通过智能技术生成

参考：
跟着大神学单细胞数据分析
 10X scRNA免疫治疗学习笔记-3-走Seurat标准流程
 单细胞测序分析之Seurat（3.0）包学习笔记
 10×单细胞测序分析练习（一）

首先，我们需要从网上下载数据，应该是一个表达矩阵，比如我们要使用的这个demo,PBMC matrix.

接下来就是在Rstudio 中的操作。

install.packages("tidyverse")
install.packages("rmarkdown")
install.packages('Seurat')

library(Seurat)
library(rmarkdown)
library(tidyverse)

#
setwd("F:/biotech/10")
pbmc.data <- read.csv("./GSE117988_raw.expMatrix_PBMC.csv",header=TRUE,row.names = 1)
dim(pbmc.data)

#对数据进行一个标准化的处理，先求每个细胞文库的总大小，然后用它的中位数除以总大小得到一个小数，然后按列乘以这个小数就相当于对文库进行了归一化，去除文库本身的大小差异
pbmc.data <- log2(1 + sweep(pbmc.data, 2, median(colSums(pbmc.data))/colSums(pbmc.data), '*'))

#这儿有1-4，这些数字代表什么呢？代表了不同的时候，即文章后面所提及到的timepoints
head(colnames(pbmc.data))
[1] "AAACCTGAGCGAAGGG.1" "AAACCTGAGGTCATCT.1" "AAACCTGAGTCCTCCT.1" "AAACCTGCACCAGCAC.1" "AAACCTGGTAACGTTC.1"
[6] "AAACCTGGTAAGGATT.1"

#读入数据这一步使用的Seurat包应该是 Seurat V3版本，创建一个对象
pbmc<- CreateSeuratObject(counts = pbmc.data, project = "10X pbmc", min.cells = 1, min.features = 0)
pbmc
head(pbmc@meta.data)

#^MT- 表示线粒体，这儿是在进行质量控制，看一下线粒体里面的数据有多少。太多了说明就是有污染
pbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")
pbmc@meta.data %>% head()

VlnPlot(pbmc, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)

在这里插入图片描述

最低0.47元/天解锁文章

leo12354

关注

4
点赞
踩
67

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录