单细胞测序分析(4)——Seurat(3.0)包学习笔记

这篇博客记录了作者学习单细胞测序分析工具Seurat(3.0)的过程,包括从下载表达矩阵数据到在RStudio中的操作步骤。作者参照了相关学习资料,并尝试进行数据分析,遇到问题并在解决中。同时,作者设想到将fastq文件转化为表达矩阵以直接分析测序数据,并计划后续研究。
摘要由CSDN通过智能技术生成

参考:
跟着大神学单细胞数据分析
10X scRNA免疫治疗学习笔记-3-走Seurat标准流程
单细胞测序分析之Seurat(3.0)包学习笔记
10×单细胞测序分析练习(一)

首先,我们需要从网上下载数据,应该是一个表达矩阵,比如我们要使用的这个demo,PBMC matrix.

接下来就是在Rstudio 中的操作。

install.packages("tidyverse")
install.packages("rmarkdown")
install.packages('Seurat')

library(Seurat)
library(rmarkdown)
library(tidyverse)
#
setwd("F:/biotech/10")
pbmc.data <- read.csv("./GSE117988_raw.expMatrix_PBMC.csv",header=TRUE,row.names = 1)
dim(pbmc.data)
#对数据进行一个标准化的处理,先求每个细胞文库的总大小,然后用它的中位数除以总大小得到一个小数,然后按列乘以这个小数就相当于对文库进行了归一化,去除文库本身的大小差异
pbmc.data <- log2(1 + sweep(pbmc.data, 2, median(colSums(pbmc.data))/colSums(pbmc.data), '*'))
#这儿有1-4,这些数字代表什么呢?代表了不同的时候,即文章后面所提及到的timepoints
head(colnames(pbmc.data))
[1] "AAACCTGAGCGAAGGG.1" "AAACCTGAGGTCATCT.1" "AAACCTGAGTCCTCCT.1" "AAACCTGCACCAGCAC.1" "AAACCTGGTAACGTTC.1"
[6] "AAACCTGGTAAGGATT.1"
#读入数据这一步使用的Seurat包应该是 Seurat V3版本,创建一个对象
pbmc<- CreateSeuratObject(counts = pbmc.data, project = "10X pbmc", min.cells = 1, min.features = 0)
pbmc
head(pbmc@meta.data)
#^MT- 表示线粒体,这儿是在进行质量控制,看一下线粒体里面的数据有多少。太多了说明就是有污染
pbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")
pbmc@meta.data %>% head()
VlnPlot(pbmc, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)

在这里插入图片描述

  • 4
    点赞
  • 67
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值