基于微阵列基因表达的基因提取选择偏差 --- .632+bootstrap

#引用

#LaTex

@article {Ambroise6562,
author = {Ambroise, Christophe and McLachlan, Geoffrey J.},
title = {Selection bias in gene extraction on the basis of microarray gene-expression data},
volume = {99},
number = {10},
pages = {6562–6566},
year = {2002},
doi = {10.1073/pnas.102102699},
publisher = {National Academy of Sciences},
abstract = {In the context of cancer diagnosis and treatment, we consider the problem of constructing an accurate prediction rule on the basis of a relatively small number of tumor tissue samples of known type containing the expression data on very many (possibly thousands) genes. Recently, results have been presented in the literature suggesting that it is possible to construct a prediction rule from only a few genes such that it has a negligible prediction error rate. However, in these results the test error or the leave-one-out cross-validated error is calculated without allowance for the selection bias. There is no allowance because the rule is either tested on tissue samples that were used in the first instance to select the genes being used in the rule or because the cross-validation of the rule is not external to the selection process; that is, gene selection is not performed in training the rule at each stage of the cross-validation process. We describe how in practice the selection bias can be assessed and corrected for by either performing a cross-validation or applying the bootstrap external to the selection process. We recommend using 10-fold rather than leave-one-out cross-validation, and concerning the bootstrap, we suggest using the so-called .632+ bootstrap error estimate designed to handle overfitted prediction rules. Using two published data sets, we demonstrate that when correction is made for the selection bias, the cross-validated error is no longer zero for a subset of only a few genes. AE,apparent error rate;CV,cross-validated;RFE,recursive feature elimination;SVM,support vector machine},
issn = {0027-8424},
URL = {http://www.pnas.org/content/99/10/6562},
eprint = {http://www.pnas.org/content/99/10/6562.full.pdf},
journal = {Proceedings of the National Academy of Sciences}
}

#Normal

Ambroise, Christophe,
and Geoffrey J. McLachlan.
“Selection bias in gene extraction on the basis of microarray gene-expression data.”
Proceedings of the National Academy of Sciences
99.10 (2002): 6562-6566.
Web. 15 May. 2018.


#主要内容

对于微阵列基因样本,其样本数目较少,基因数目非常多

提出了一种更准确的测试评估方法。

偏倚选择 — 基于部分样本训练,基于部分样本测试

结果过于乐观

M M M折交叉验证 CV


##Bootstrap

R R R — 预测规则
R k ∗ R_k^* Rk — bootstrap版本的 R R R
K K K — 大小为 n n n的bootstrap采样次数,有放回的
n n n — 原始样本大小

B 1 B1 B1 — 留一法bootstrap误差,对于bootstrap平滑处理的留一法交叉验证,只对未在bootstrap样本的点进行预测

基于 K K K次bootstrap采样的 B 1 B1 B1的Monte Carlo估计如下:

这里写图片描述

I j k I_{jk} Ijk

  • 1, x j x_j xj未在bootstrap样本中
  • 0,反之

k k k — bootstrap采样当前次数

Q j k Q_{jk} Qjk

  • 1, R k ∗ R^*_k Rk x j x_j xj错误归类
  • 0,反之

一般, B . 632 B.632 B.632计算如下:

这里写图片描述

B . 632 + B.632+ B.632+计算如下:

这里写图片描述

这里写图片描述

这里写图片描述

来自类 i i i的样本比例为 p i p_i pi q i q_i qi为它们中被 R R R分到类 i i i的比例。

r r r需要被截断以使其在范围 [ 0 , 1 ] [0,1] [0,1]

w w w的值从B.632( r = 0 r=0 r=0)到B1( r = 1 r=1 r=1)

*B.632+*估计赋予了bootstrap留一误差B1更多的权重,其中,B1-AE所度量的过拟合量相对较大,因此,在当前预测规则 R R R由于特征选择是过拟合的情况下,也是可用的。

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

在Spring Cloud Config中,有几种常见的配置文件,包括`bootstrap.yml`、`bootstrap-dev.yml`和`bootstrap-local.yml`。这些配置文件具有不同的优先级和用途。 1. `bootstrap.yml`是用于获取外部配置的特殊配置文件,它的加载优先级比其他配置文件(如`application.yml`或`application.properties`)更高[^1]。它主要用于加载一些启动阶段需要用到的配置信息,例如连接到Spring Cloud Config Server的配置、加密/解密信息、连接到外部数据库的配置等。由于这些配置信息在应用程序启动的早期阶段就需要用到,所以放在`bootstrap.yml`中确保它们在其他配置之前加载。此外,`bootstrap.yml`不会被本地配置文件覆盖,它的优先级更高,确保这些关键配置的安全性和准确性。 2. `bootstrap-dev.yml`是`bootstrap.yml`的一个特定的开发环境profile,用于在开发环境下加载特定的外部配置信息。在开发环境中,可能需要与生产环境不同的配置,例如连接到不同的数据库、使用不同的服务地址等。通过使用`bootstrap-dev.yml`可以轻松地区分开发环境和其他环境的配置。当在开发环境启动应用程序时,Spring Cloud Config将会加载`bootstrap.yml`和`bootstrap-dev.yml`的配置,并根据当前激活的profile(如通过`spring.profiles.active`属性指定)加载对应的配置。 3. `bootstrap-local.yml`是一个自定义的本地配置文件,用于加载本地环境下的特定配置信息。它的优先级比`bootstrap.yml`和`bootstrap-dev.yml`更高,可以用于覆盖这两个文件中的配置。通过使用`bootstrap-local.yml`,可以在本地环境中加载特定的配置,例如本地数据库的连接信息、本地服务的地址等。 综上所述,`bootstrap.yml`具有最低的优先级,用于加载一些启动阶段需要用到的配置信息。`bootstrap-dev.yml`是用于开发环境的特定配置文件,用于加载开发环境下的配置。`bootstrap-local.yml`是一个自定义的本地配置文件,用于加载本地环境下的特定配置信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值