pbcmc包的介绍（根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理）

weixin_51547801

已于 2022-04-10 21:08:42 修改

阅读量870

点赞数

文章标签： r语言

于 2022-04-03 21:52:24 首次发布

本文链接：https://blog.csdn.net/weixin_51547801/article/details/123944025

版权

pbcmc包是基于R语言的BioConductor平台，用于评估基因表达分类器的不确定性，尤其针对PAM50分子签名。通过排列测试构建零分布，为每个样本提供分类置信度报告。该包适用于Genefu中的PAM50实现，可以通过BreastCancerXXX数据集或自定义数据进行操作，涉及数据筛选、分类和验证步骤。用户可利用BiocParallel包加速计算，同时提供详细的报告输出。

摘要由CSDN通过智能技术生成

pbcmc包的介绍（根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理，感谢Jimmy老师！）

1.使用BioConductor的BreastCancerXXX数据集
2.使用任何微阵列R数据包
3.用PAM50 centroids作为验证

pbcmc: Permutation-Based Confidence for Molecular Classification
Bioconductor link: https://bioconductor.riken.jp/packages/3.3/bioc/html/pbcmc.html
亮点：Pbcmc包的特点是基于排列测试（置换检验，permutation test）对基因表达分类器（也称为molecular signatures，ms）进行不确定性评估。为了实现这一目标，通过排列基因labels以构成模拟对象。然后，针对相应的亚型分类器对每个模拟对象进行测试，以构建零分布。因此，可以为每个受试者提供分类置信度评估报告，以帮助医生选择治疗方案。目前，它只适用于Genefu包中的PAM50实现，但可以很容易地扩展到其他molecular signatures中。

（注：运行到第三步用PAM50 centroids作为验证的object<-filtrate(object, verbose=TRUE)时提示出错：'pam50' is not an exported object from 'namespace:genefu'，宠粉曾老师解决后还写了一篇推文，大家可以移步观看！使用R包的内置数据不能通过两个冒号吗？）

1.使用BioConductor的BreastCancerXXX数据集

为了使用PAM50 MS，用户必须加载BioConductor的BreastCancerXXX数据集，其中XXX代表UPP、NKI、VDX、TRANSBIG、Mainz或UNT。例如，我们可以加载NKI数据库，前提是安装了所需的库，使用以下代码：

# install.packages("pbcmc_1.6.0.tar.gz",repos = NULL, type="source")    #用BiocManager安装失败，进行了本地安装。
#
# if (!require("BiocManager", quietly = TRUE))
#   install.packages("BiocManager")
# BiocManager::install("BiocParallel")      #并行计算
# BiocManager::install("breastCancerNKI")   #数据集
# BiocManager::install("genefu")            #PAM50
# #BiocManager::install("biomaRt")          #可能需要加载的依赖包
# #BiocManager::install("vctrs")            #可能需要加载的依赖包

library("biomaRt")
library("pbcmc")
library("BiocParallel")
library("breastCancerNKI")
library("genefu")

object<-loadBCDataset(Class=PAM50, libname="nki", verbose=TRUE)
object
# A PAM50 molecular permutation classifier object
# Dimensions:
#             nrow ncol
# exprs      24481  337
# annotation 24481   10
# targets      337   21

该对象是一个PAM50的例子，它包含exprs矩阵，该矩阵带有targets data.frame（目标数据框）中的基因表达值、相关注释和临床数据。另一方面，用户可以借用PAM50的构造函数使用他/她自己的数据创建对象，或者使用 .PAM50(MAList_Object) 函数将 Limma MAList 对象转换为PAM50。在第一种情况下，用户只需要：

a）M gene expression object，基因表达对象M，行为基因、列为样本。
b）annotation data.frame，注释数据框，必须包含：“Probe”、“NCBI.gene.Symbol”和“EntrezGene.ID”这三列。
c）targets data.frame，目标数据框，这是一个可选slot。如果要准备它，行数应该与M中的样本数一样，列数与这些样本可用的临床或实验数据数一样。以“nki”为例&#

最低0.47元/天解锁文章

weixin_51547801

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pbcmc包的介绍（根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理）

pbcmc包的介绍（根据生信技能树Jimmy老师分享的乳腺癌分子分型包资料整理，感谢Jimmy老师！）pbcmc: Permutation-Based Confidence for Molecular ClassificationBioconductor link: https://bioconductor.riken.jp/packages/3.3/bioc/html/pbcmc.html亮点：几种生物信息学工具可用于从基因表达谱中推断患者亚型，包括经过充分研究的PAM50。这些工具中使用的特定算
复制链接

扫一扫