R语言 NMF 如何自动判断最佳rank的数目

1. 用NMF示例方法产生默认的判断rank数的图片

library(NMF)
data("esGolub")
esGolub <- esGolub[1:200,]
esGolub$Sample <- NULL
estim.r <- nmf(esGolub, 2:6, nrun=10, seed=123456)
plot(estim.r)
plot(2:6,estim.r$measures$cophenetic, type="b", col="purple")

结果展示
在这里插入图片描述
通过图我们判断,最佳聚类数为3,筛选准则来源于原文献中的一句话:
We select values of k where the magnitude of the cophenetic correlation coefficient begins to fall

2. 提取cophenetic 数据

NMF方法中判断rank最重要的标准是cophenetic的大小,所以从上面的计算结果中提取cophenetic 数据

coph <- estim.r$measures$cophenetic
plot(2:6,coph, type="b", col="purple")

结果展示
在这里插入图片描述
观察到结果和图集一中的图完全一致,说明我们提取的数据和示例展示的数据是一致的,接下来我们用判断准则,编写相关代码,实现自动判断。

3. 实现自动判断最佳rank值

判断最佳rank值的准则就是,cophenetic 值随K变化的最大变动的前点,如3-4变化最大,所以选择最佳rank值为3
这是我自己根据文章的理解,欢迎讨论和批评指正。

coph_diff <- NULL
for (i in 2:length(coph)) 
{
  coph_diff <- c(coph_diff, coph[i-1]-coph[i])
}
k.best <- which.max(coph_diff)+1

参考文献:
Metagenes and molecular pattern discovery using matrix factorization

  • 4
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值