pbcmc包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理,感谢Jimmy老师!)
pbcmc: Permutation-Based Confidence for Molecular Classification
Bioconductor link: https://bioconductor.riken.jp/packages/3.3/bioc/html/pbcmc.html
亮点:Pbcmc包的特点是基于排列测试(置换检验,permutation test)对基因表达分类器(也称为molecular signatures,ms)进行不确定性评估。为了实现这一目标,通过排列基因labels以构成模拟对象。 然后,针对相应的亚型分类器对每个模拟对象进行测试,以构建零分布。 因此,可以为每个受试者提供分类置信度评估报告,以帮助医生选择治疗方案。 目前,它只适用于Genefu包中的PAM50实现,但可以很容易地扩展到其他molecular signatures中。
(注:运行到第三步用PAM50 centroids作为验证的object<-filtrate(object, verbose=TRUE)
时提示出错:'pam50' is not an exported object from 'namespace:genefu'
,宠粉曾老师解决后还写了一篇推文,大家可以移步观看!使用R包的内置数据不能通过两个冒号吗?)
1.使用BioConductor的BreastCancerXXX数据集
为了使用PAM50 MS,用户必须加载BioConductor的BreastCancerXXX数据集,其中XXX代表UPP、NKI、VDX、TRANSBIG、Mainz或UNT。例如,我们可以加载NKI数据库,前提是安装了所需的库,使用以下代码:
# install.packages("pbcmc_1.6.0.tar.gz",repos = NULL, type="source") #用BiocManager安装失败,进行了本地安装。
#
# if (!require("BiocManager", quietly = TRUE))
# install.packages("BiocManager")
# BiocManager::install("BiocParallel") #并行计算
# BiocManager::install("breastCancerNKI") #数据集
# BiocManager::install("genefu") #PAM50
# #BiocManager::install("biomaRt") #可能需要加载的依赖包
# #BiocManager::install("vctrs") #可能需要加载的依赖包
library("biomaRt")
library("pbcmc")
library("BiocParallel")
library("breastCancerNKI")
library("genefu")
object<-loadBCDataset(Class=PAM50, libname="nki", verbose=TRUE)
object
# A PAM50 molecular permutation classifier object
# Dimensions:
# nrow ncol
# exprs 24481 337
# annotation 24481 10
# targets 337 21
该对象是一个PAM50的例子,它包含exprs矩阵,该矩阵带有targets data.frame(目标数据框)中的基因表达值、相关注释和临床数据。另一方面,用户可以借用PAM50的构造函数使用他/她自己的数据创建对象,或者使用 .PAM50(MAList_Object) 函数将 Limma MAList 对象转换为PAM50。在第一种情况下,用户只需要:
a)M gene expression object,基因表达对象M,行为基因、列为样本。
b)annotation data.frame,注释数据框,必须包含:“Probe”、“NCBI.gene.Symbol”和“EntrezGene.ID”这三列。
c)targets data.frame,目标数据框,这是一个可选slot。如果要准备它,行数应该与M中的样本数一样,列数与这些样本可用的临床或实验数据数一样。以“nki”为例&#