机器学习
文章平均质量分 67
厚德载物lyh
不断充实自我
展开
-
线性回归要求因变量服从正态分布
对于线性回归模型,当因变量服从正态分布,误差项满足高斯–马尔科夫条件(零均值、等方差、不相关)时,回归参数的最小二乘估计是一致最小方差无偏估计.解释一:我们假设线性回归的噪声服从均值为0的正态分布。 当噪声符合正态分布N(0,delta^2)时,因变量则符合正态分布N(ax(i)+b,delta^2),其中预测函数y=ax(i)+b。这个结论可以由正态分布的概率密度函数得到。也就是说当噪声符合正态原创 2017-04-27 11:31:03 · 58238 阅读 · 1 评论 -
随机森林回归应用中遇到的问题
随机森林算法的应用本人在做kaggle的house prices题目时用到了随机森林回归的算法,遇到了一些问题,现在记录下来。随机森立对于线性相关的特征是否有影响?特征简化后效果会变好,为什么?随机森林算法原理见http://www.zilhua.com/629.html。一、线性相关性 随机森林对多元共线性不敏感,结果对缺失数据和非平衡的数据比较稳健,可以很好地预测多达几千个解释变量的作原创 2017-04-21 11:09:08 · 21762 阅读 · 2 评论