单细胞专题-Day1
第一件事当然是装包啦~
需要安装的R包:
cran包:'tidyverse','msigdbr', 'patchwork','SeuratObject','Seurat'
Bioconductor包: 'sva', 'monocle', 'GOplot','GSVA','plotmo','regplot','scRNAseq','BiocStyle','celldex','SingleR','BiocParallel'
装包超实用小函数:require
对于加载成功的包,返回逻辑值T
,未装的包返回F
,用于装包时代码的分情况讨论。
单细胞数据库
- GEO
- Single Cell Portal
- Human Cell Atlas
- Single Cell Expression Atlas
- UCSC
不同类型文件的读取方法:https://mp.weixin.qq.com/s/W7szy-Kg6G1N1ENHNRjGiw 需要时查询即可。
多样本数据整理
跟着小洁老师,不用再手动整理文件夹!代码操作yyds!!
- 解压:
untar("GSE231920_RAW.tar",exdir = "GSE231920_RAW")#解包
library(stringr)
fs = paste0("GSE231920_RAW/",dir("GSE231920_RAW/"))
fs#查看每个样本的数据文件
- 从文件名中提取样本名
samples = dir("GSE231920_RAW/") %>% str_split_i(pattern = "_",i = 2) %>% unique();samples
不同样本需要修改代码,该例子为分割GSM7306054_sample1_barcodes.tsv.gz
这一文件名
dir()
列出工作目录下文件
- 为每个样本创建单独文件夹