pbcmc包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理)

pbcmc包是基于R语言的BioConductor平台,用于评估基因表达分类器的不确定性,尤其针对PAM50分子签名。通过排列测试构建零分布,为每个样本提供分类置信度报告。该包适用于Genefu中的PAM50实现,可以通过BreastCancerXXX数据集或自定义数据进行操作,涉及数据筛选、分类和验证步骤。用户可利用BiocParallel包加速计算,同时提供详细的报告输出。
摘要由CSDN通过智能技术生成

pbcmc包的介绍(根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理,感谢Jimmy老师!)

pbcmc: Permutation-Based Confidence for Molecular Classification
Bioconductor link: https://bioconductor.riken.jp/packages/3.3/bioc/html/pbcmc.html
亮点:Pbcmc包的特点是基于排列测试(置换检验,permutation test)对基因表达分类器(也称为molecular signatures,ms)进行不确定性评估。为了实现这一目标,通过排列基因labels以构成模拟对象。 然后,针对相应的亚型分类器对每个模拟对象进行测试,以构建零分布。 因此,可以为每个受试者提供分类置信度评估报告,以帮助医生选择治疗方案。 目前,它只适用于Genefu包中的PAM50实现,但可以很容易地扩展到其他molecular signatures中。

(注:运行到第三步用PAM50 centroids作为验证的object<-filtrate(object, verbose=TRUE)时提示出错:'pam50' is not an exported object from 'namespace:genefu',宠粉曾老师解决后还写了一篇推文,大家可以移步观看!使用R包的内置数据不能通过两个冒号吗?

1.使用BioConductor的BreastCancerXXX数据集

为了使用PAM50 MS,用户必须加载BioConductor的BreastCancerXXX数据集,其中XXX代表UPP、NKI、VDX、TRANSBIG、Mainz或UNT。例如,我们可以加载NKI数据库,前提是安装了所需的库,使用以下代码:

# install.packages("pbcmc_1.6.0.tar.gz",repos = NULL, type="source")    #用BiocManager安装失败,进行了本地安装。
#
# if (!require("BiocManager", quietly = TRUE))
#   install.packages("BiocManager")
# BiocManager::install("BiocParallel")      #并行计算
# BiocManager::install("breastCancerNKI")   #数据集
# BiocManager::install("genefu")            #PAM50
# #BiocManager::install("biomaRt")          #可能需要加载的依赖包
# #BiocManager::install("vctrs")            #可能需要加载的依赖包

library("biomaRt")
library("pbcmc")
library("BiocParallel")
library("breastCancerNKI")
library("genefu")

object<-loadBCDataset(Class=PAM50, libname="nki", verbose=TRUE)
object
# A PAM50 molecular permutation classifier object
# Dimensions:
#             nrow ncol
# exprs      24481  337
# annotation 24481   10
# targets      337   21

该对象是一个PAM50的例子,它包含exprs矩阵,该矩阵带有targets data.frame(目标数据框)中的基因表达值、相关注释和临床数据。另一方面,用户可以借用PAM50的构造函数使用他/她自己的数据创建对象,或者使用 .PAM50(MAList_Object) 函数将 Limma MAList 对象转换为PAM50。在第一种情况下,用户只需要:

a)M gene expression object,基因表达对象M,行为基因、列为样本。
b)annotation data.frame,注释数据框,必须包含:“Probe”、“NCBI.gene.Symbol”和“EntrezGene.ID”这三列。
c)targets data.frame,目标数据框,这是一个可选slot。如果要准备它,行数应该与M中的样本数一样,列数与这些样本可用的临床或实验数据数一样。以“nki”为例&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值