![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Statistics
jran_ml
这个作者很懒,什么都没留下…
展开
-
机器学习中的变量选择——进阶篇
机器学习中的变量选择变量选择回顾单变量筛选通过模型选择变量变量选择进阶只用模型就能选好变量么数据处理模型介绍实验结果认识伪相关两步法估计变量选择回顾符号说明:p:p:p: 特征数量n:n:n: 样本数量变量选择在机器学习中扮演着重要的角色,无论是对于构建一个可解释的模型,还是提升模型的预测能力。单变量筛选在高维情况下,有时候我们需要预先筛选部分变量,然后再训练模型。筛选过程需要做到...原创 2019-03-03 13:42:17 · 19996 阅读 · 2 评论 -
AB测试中如何给样本分组?
目录什么是AB测试?什么叫相似?为什么要相似?怎么实现相似?随机化(Rerandomization)再随机化[^2]协方差适应的再随机化(Covariance-Adaptive Rerandomization)[^3]什么是AB测试?AB测试现在大规模出现在互联网产品迭代更新中。为Web或App界面或流程制作两个(A/B)或多个(A/B/n)版本,在同一时间维度,分别让组成成分相同(相似)的访...原创 2019-03-11 18:26:36 · 7629 阅读 · 0 评论 -
机器学习里的 kernel 是指什么?
转自我的知乎回答:机器学习里的 kernel 是指什么?我换个角度来解释这个问题。机器学习在做回归或者分类时有一个很朴实的想法:预测 x 的值,那就在训练集 X 中寻找那些与 x 相似的样本,再把这些样本的值加权作为预测值。 这里有两个问题:如何度量样本之间的相似性?如何加权?下面先看三个例子:k近邻。这个很熟悉,一般用欧式距离寻找离 x 最近的 k 个点,然后把对应的 y 等权...原创 2019-03-17 09:46:03 · 1410 阅读 · 0 评论