概率统计
文章平均质量分 84
kensun0
这个作者很懒,什么都没留下…
展开
-
bootstrap浅解
假设我们有n个样本,分别从X1~Xn,我们不知道样本来自什么分布,姑且说是来自F分布吧。也假定他有一个固定的均值u对于一个估计T,T=g(X1~Xn),是说估计是由样本组成的。例如根据大数定律,(X1+...+Xn)/n是近似的F分布均值的估计值,注意,该估计是一个随机变量,因为每次都样本不同有几个问题:T 服从什么分布?T的均值是什么,方差是多少?T是什么分布,这里我们暂不考虑。原创 2012-12-06 15:37:32 · 870 阅读 · 0 评论 -
数据标准化的原因及方法
一、为何要将数据标准化?由于不同变量常常具有不同的单位和不同的变异程度。 不同的单位常使系数的实践解释发生困难。例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出现将两个事例中第1个变量观察值之差的绝对值(单位是kg)与第2个变量观察值之差的绝对值(单位是cm)相加的情况。使用者会说5kg的差异怎么可以与3cm的差异相加? 不同变量自身具有相差较大的变异时,会使转载 2015-07-03 11:16:14 · 8468 阅读 · 1 评论