数据挖掘
小飞鱼露
机器学习 大规模数据挖掘 个性化推荐
展开
-
当我们的经验无法适应新环境的时候该怎么办? Covariate Shift
前几天偶然看到 Alex Smola (CMU ML Prof) 的一篇 " Real simple covariate shift correction" 博文,论述在机器学习领域一个非常容易被忽略的问题, “Covariate Shift”。最为直观的解释就是当你的训练集的样本分布和测试集的样本分布一致的时候,你训练得到的模型是无法有很好的泛化 (Generalization) 能力的。假原创 2014-03-02 09:22:18 · 5942 阅读 · 0 评论 -
正则化的最小二乘法
在单元 (unimodal) 目标变量的线性模型中,MLE (Maximum likelihood) 和 Least Squares (最小二乘法) 是常用的两种估计模型参数向量 W 的解法。他们都有个共同点,求解得到的参数向量 W 能够保证估计的目标值和观测得到的目标值之间的误差最小。但是单纯的考虑误差最小化得到的模型会有过拟合现象,也就是预测效果会很差。为了解决这个问题,在目标函数中往往都会考原创 2014-03-01 14:35:12 · 23245 阅读 · 0 评论